網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

等等，這些圖是GPT-Image-2出的？！

2026-04-21 19:37:50　來源: 愛范兒

廣東舉報

分享至

在互聯(lián)網(wǎng)上吃瓜、維權(quán)、實錘一件事，過去我們靠的是五個字：有圖有真相。

哪怕 AI 生圖已經(jīng)鋪天蓋地，但只要圖里出現(xiàn)復(fù)雜的中文排版，或者某款軟件的真實界面，AI 就會立刻露餡，變成一個徹底的「文盲」。

▲ 圖片來源：X@hx831126

但現(xiàn)在，這個時代到頭了。

那個靠找錯別字、找 UI 漏洞來鑒別 AI 圖片的年代，隨著 ChatGPT 旗下圖像模型 GPT Image 2 的全量推送，已經(jīng)轟然收場。

APPSO 第一時間用最刁鉆的中文場景和商業(yè)需求對它展開了壓力測試，不用抽卡，每張都出乎意料的好。

打開 ChatGPT，點擊 + 號，選擇「創(chuàng)建圖片」，或在右側(cè)邊欄更多中找到「圖片」，就可以使用 GPT Image 2。目前，任何訂閱計劃，包括免費(fèi)用戶，都可以直接使用。

數(shù)學(xué)試卷都能偽造，中文渲染新王

當(dāng)初 Nano Banana 就是靠著文字渲染，一舉成為 AI 生圖界的「神」。但盡管 Nano Banana 在文字處理上比其他模型強(qiáng)上不少，面對一些超量文本時，Nano Banana 的表現(xiàn)，還是會出現(xiàn)個別文字的錯位，以及對文字的排版布局比較生硬。

現(xiàn)在，GPT Image 2 的出現(xiàn)，把這個局面徹底翻過去了。它不僅懂中文字形，還懂極其復(fù)雜的中文排版。

使用 GPT Image 2 甚至不太需要過于復(fù)雜的提示詞，我們的測試都是一兩句簡單的畫面描述。

例如讓它生成廣州市小學(xué)數(shù)學(xué)試卷。

▲提示詞：生成廣州市小學(xué)數(shù)學(xué)試卷

結(jié)果相當(dāng)震撼。卷頭標(biāo)題、填空題下劃線、幾何圖形標(biāo)注，以及試卷特有的宋體 / 楷體排版風(fēng)格，全被精準(zhǔn)還原。第一眼看，這完全就是一張拿手機(jī)對著真實考卷拍出來的照片。

如果這種統(tǒng)一字體的文字，算不上有難度的話，我們嘗試?yán)^續(xù)用中國傳統(tǒng)書法去難倒它。

▲提示詞：生成《蜀道難》真跡圖片

GPT Image 2 表示，這仍然難不倒我。生成的書法真跡圖片，里面的文字不僅準(zhǔn)確，還做到了書法作品應(yīng)有的行云流水、筆鋒蒼勁。甚至連紙張的做舊紋理，一些印鑒都到位了。

對于一些圖文并茂的排版測試， GPT Image 2 的表現(xiàn)同樣嚴(yán)絲合縫，沒有任何亂碼或字體重疊。

▲提示詞：一張泛黃的今日人工智能晚報，時間是 2049 年 4 月 21 日

當(dāng)一個 AI 模型能以假亂真地生成帶題目的試卷、完美渲染中文日歷，這句過去的成語「眼見為實」，真的徹底被擊破了。

相信把那張四年級的試卷給小學(xué)生看，真的會找不到破綻。

配合文字，可以 1:1 還原整個數(shù)字世界

中文渲染只是基本功的補(bǔ)全，GPT Image 2 更驚艷的，是它展現(xiàn)出的世界知識的厚度。

包括前段時間 GPT Image 2 爆料中瘋傳的那些圖片，馬斯克在抖音直播買老干媽、奧特曼同平臺競爭，都是基于 GPT Image 2 強(qiáng)大的文本渲染能力和世界知識。

世界知識這個概念，在 Nano Banana 爆火的時候，就開始流行，意思是就是生圖模型也會有通用模型的知識，可以聯(lián)網(wǎng)搜索，會思考，它真的知道我們每天盯著的屏幕、玩的游戲、看的直播，到底長什么樣。

我們隨手輸入了一個極具互聯(lián)網(wǎng)特色的場景。

▲提示詞：一個漂亮的美女主播在抖音直播

出來的圖里不只有人物，更恐怖的是它完整復(fù)刻了抖音的 UI 界面。左下角的評論區(qū)、右側(cè)的點贊和分享按鈕、頂部的觀眾人數(shù)和跑馬燈，所有交互元素的層級邏輯全部正確。

游戲玩家可能感受更深。當(dāng)我們讓它還原英雄聯(lián)盟的團(tuán)戰(zhàn)畫面，它不僅畫出了峽谷地形，英雄頭頂?shù)难獥l、技能特效的光影、小地圖的 UI 框，也一并安排到位了。

▲提示詞：英雄聯(lián)盟游戲畫面，召喚師峽谷地圖，經(jīng)典的等距俯視視角，幾個英雄正在進(jìn)行激烈的團(tuán)戰(zhàn)。

甚至科技圈的名場面，它也了如指掌。一句話，就能精準(zhǔn)還原 Sam Altman 的面部特征、OpenAI 極簡的舞臺打光，以及套著視頻播放器外殼的直播界面。

▲提示詞：GPT-Image-2 發(fā)布會直播畫面，包含 Sam Altman

GPT Image 2 對這個數(shù)字世界視覺規(guī)律的掌握程度，比我們想象的都要更深。

XX is Dead，再一次顛覆設(shè)計、營銷、廣告……

技術(shù)的快速推進(jìn)背面，是一批舊工作流的終結(jié)。

AI 跨過了文字和 UI 的門檻，生圖這件事就徹底脫離了「藝術(shù)創(chuàng)作」的范疇，成了一種硬核的商業(yè)生產(chǎn)力工具。這次實測里，GPT Image 2 的商業(yè)落地能力，足以讓許多設(shè)計師坐不住。

工業(yè)與產(chǎn)品設(shè)計領(lǐng)域，復(fù)雜的機(jī)械結(jié)構(gòu)和建模往往耗費(fèi)大量時間，而現(xiàn)在只需幾秒。

▲提示詞：給「張雪機(jī)車」的摩托車設(shè)計一張酷炫的產(chǎn)品分解圖

懸浮的零件排布、極具科技感的光影，這種過去需要 3D 建模師肝上幾天的圖，它能瞬間給出高品質(zhì)的原型參考。

▲圖片來源：X@hx831126

電商和廣告視覺方面，蘋果那種冷峻高級的質(zhì)感，或者電商平臺要求的高飽和度、帶中文促銷文案的網(wǎng)感圖，它都游刃有余。

▲提示詞：iPhone 16 Pro Max 高端商業(yè)廣告

▲提示詞：產(chǎn)品廣告照片，一個游泳圈，有吸引力，能獲得大量點擊率，16:9，使用中文

宣發(fā)和 IP 創(chuàng)作上，GPT Image 2 的排版邏輯和特征抓取同樣表現(xiàn)出現(xiàn)。中文字體排版直接可用，分鏡邏輯清晰，連各家大模型的 Logo 特征，都能被它做成頗具網(wǎng)感的 IP 延展。

▲提示詞：給電影拯救計劃設(shè)計一張橫屏海報（雖然他不知道高司令的拯救計劃，但是選的幾個演員確實是大片演員）

▲提示詞：經(jīng)典漫畫書內(nèi)頁，包含分鏡格子、人物動態(tài)動作、對話氣泡

▲提示詞：生成一系列不同的 AI 大語言模型（Gemini、deepseek、ChatGPT、Claude、Grok 等）的表情包設(shè)計

過去設(shè)計師對齊需求時，找各種參考、搭復(fù)雜的設(shè)計框架、排版修字。現(xiàn)在，一段清晰簡單的提示詞進(jìn)去，一張可以直接用于商業(yè)提案、電商投放甚至直接出街的成品就出來了。

在我們測試過程中，無論是 Plus 賬號還是免費(fèi)賬號，都已經(jīng)上線了 GPT Image 2，大家可以在自己的 ChatGPT 對話框里試試。

不過，目前仍然會有速率限制的提示，當(dāng)我們頻繁發(fā)送提示詞，要求 ChatGPT 生成時，他會直接回復(fù)一段錯誤代碼，顯示「你的圖片生成速度太快了，為了保證所有人最好的體驗，我們有速率限制，請在 13 分鐘后生成。」

不得不說，每當(dāng)我們覺得 OpenAI 陷入停滯，它總能在你毫無防備的時候甩出一張新牌。

過去幾個月，外界吐槽它發(fā)新模型是擠牙膏、Sora 關(guān)閉、ChatGPT Atlas 瀏覽器爆冷，仿佛那個曾經(jīng)不可一世的 AI 霸主真的變菜了。

今天 GPT Image 2 的出現(xiàn)，也算是給了這些唱衰一次有力的回應(yīng)。

當(dāng)一個模型能以假亂真地生成數(shù)學(xué)試卷、完整復(fù)刻抖音直播界面，「這是 AI 做的」我想很難是一眼能看穿的事了。

那個「有圖有真相」的時代，是真的回不去了。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.