![]()
在互聯(lián)網(wǎng)上吃瓜、維權(quán)、實錘一件事,過去我們靠的是五個字:有圖有真相。
哪怕 AI 生圖已經(jīng)鋪天蓋地,但只要圖里出現(xiàn)復(fù)雜的中文排版,或者某款軟件的真實界面,AI 就會立刻露餡,變成一個徹底的「文盲」。
![]()
▲ 圖片來源:X@hx831126
但現(xiàn)在,這個時代到頭了。
那個靠找錯別字、找 UI 漏洞來鑒別 AI 圖片的年代,隨著 ChatGPT 旗下圖像模型 GPT Image 2 的全量推送,已經(jīng)轟然收場。
APPSO 第一時間用最刁鉆的中文場景和商業(yè)需求對它展開了壓力測試,不用抽卡,每張都出乎意料的好。
![]()
打開 ChatGPT,點擊 + 號,選擇「創(chuàng)建圖片」,或在右側(cè)邊欄更多中找到「圖片」,就可以使用 GPT Image 2。目前,任何訂閱計劃,包括免費(fèi)用戶,都可以直接使用。
數(shù)學(xué)試卷都能偽造,中文渲染新王
當(dāng)初 Nano Banana 就是靠著文字渲染,一舉成為 AI 生圖界的「神」。但盡管 Nano Banana 在文字處理上比其他模型強(qiáng)上不少,面對一些超量文本時,Nano Banana 的表現(xiàn),還是會出現(xiàn)個別文字的錯位,以及對文字的排版布局比較生硬。
現(xiàn)在,GPT Image 2 的出現(xiàn),把這個局面徹底翻過去了。它不僅懂中文字形,還懂極其復(fù)雜的中文排版。
使用 GPT Image 2 甚至不太需要過于復(fù)雜的提示詞,我們的測試都是一兩句簡單的畫面描述。
例如讓它生成廣州市小學(xué)數(shù)學(xué)試卷。
![]()
▲提示詞:生成廣州市小學(xué)數(shù)學(xué)試卷
結(jié)果相當(dāng)震撼。卷頭標(biāo)題、填空題下劃線、幾何圖形標(biāo)注,以及試卷特有的宋體 / 楷體排版風(fēng)格,全被精準(zhǔn)還原。第一眼看,這完全就是一張拿手機(jī)對著真實考卷拍出來的照片。
如果這種統(tǒng)一字體的文字,算不上有難度的話,我們嘗試?yán)^續(xù)用中國傳統(tǒng)書法去難倒它。
![]()
▲提示詞:生成《蜀道難》真跡圖片
GPT Image 2 表示,這仍然難不倒我。生成的書法真跡圖片,里面的文字不僅準(zhǔn)確,還做到了書法作品應(yīng)有的行云流水、筆鋒蒼勁。甚至連紙張的做舊紋理,一些印鑒都到位了。
對于一些圖文并茂的排版測試, GPT Image 2 的表現(xiàn)同樣嚴(yán)絲合縫,沒有任何亂碼或字體重疊。![]()
▲提示詞:一張泛黃的今日人工智能晚報,時間是 2049 年 4 月 21 日
當(dāng)一個 AI 模型能以假亂真地生成帶題目的試卷、完美渲染中文日歷,這句過去的成語「眼見為實」,真的徹底被擊破了。
相信把那張四年級的試卷給小學(xué)生看,真的會找不到破綻。
配合文字,可以 1:1 還原整個數(shù)字世界
中文渲染只是基本功的補(bǔ)全,GPT Image 2 更驚艷的,是它展現(xiàn)出的世界知識的厚度。
包括前段時間 GPT Image 2 爆料中瘋傳的那些圖片,馬斯克在抖音直播買老干媽、奧特曼同平臺競爭,都是基于 GPT Image 2 強(qiáng)大的文本渲染能力和世界知識。
世界知識這個概念,在 Nano Banana 爆火的時候,就開始流行,意思是就是生圖模型也會有通用模型的知識,可以聯(lián)網(wǎng)搜索,會思考,它真的知道我們每天盯著的屏幕、玩的游戲、看的直播,到底長什么樣。
我們隨手輸入了一個極具互聯(lián)網(wǎng)特色的場景。
![]()
▲提示詞:一個漂亮的美女主播在抖音直播
出來的圖里不只有人物,更恐怖的是它完整復(fù)刻了抖音的 UI 界面。左下角的評論區(qū)、右側(cè)的點贊和分享按鈕、頂部的觀眾人數(shù)和跑馬燈,所有交互元素的層級邏輯全部正確。
游戲玩家可能感受更深。當(dāng)我們讓它還原英雄聯(lián)盟的團(tuán)戰(zhàn)畫面,它不僅畫出了峽谷地形,英雄頭頂?shù)难獥l、技能特效的光影、小地圖的 UI 框,也一并安排到位了。
![]()
▲提示詞:英雄聯(lián)盟游戲畫面,召喚師峽谷地圖,經(jīng)典的等距俯視視角,幾個英雄正在進(jìn)行激烈的團(tuán)戰(zhàn)。
甚至科技圈的名場面,它也了如指掌。一句話,就能精準(zhǔn)還原 Sam Altman 的面部特征、OpenAI 極簡的舞臺打光,以及套著視頻播放器外殼的直播界面。
![]()
▲提示詞:GPT-Image-2 發(fā)布會直播畫面,包含 Sam Altman
GPT Image 2 對這個數(shù)字世界視覺規(guī)律的掌握程度,比我們想象的都要更深。
XX is Dead,再一次顛覆設(shè)計、營銷、廣告……
技術(shù)的快速推進(jìn)背面,是一批舊工作流的終結(jié)。
AI 跨過了文字和 UI 的門檻,生圖這件事就徹底脫離了「藝術(shù)創(chuàng)作」的范疇,成了一種硬核的商業(yè)生產(chǎn)力工具。這次實測里,GPT Image 2 的商業(yè)落地能力,足以讓許多設(shè)計師坐不住。
工業(yè)與產(chǎn)品設(shè)計領(lǐng)域,復(fù)雜的機(jī)械結(jié)構(gòu)和建模往往耗費(fèi)大量時間,而現(xiàn)在只需幾秒。
![]()
▲提示詞:給「張雪機(jī)車」的摩托車設(shè)計一張酷炫的產(chǎn)品分解圖
懸浮的零件排布、極具科技感的光影,這種過去需要 3D 建模師肝上幾天的圖,它能瞬間給出高品質(zhì)的原型參考。
![]()
▲圖片來源:X@hx831126
電商和廣告視覺方面,蘋果那種冷峻高級的質(zhì)感,或者電商平臺要求的高飽和度、帶中文促銷文案的網(wǎng)感圖,它都游刃有余。
![]()
▲提示詞:iPhone 16 Pro Max 高端商業(yè)廣告
![]()
▲提示詞:產(chǎn)品廣告照片,一個游泳圈,有吸引力,能獲得大量點擊率,16:9,使用中文
宣發(fā)和 IP 創(chuàng)作上,GPT Image 2 的排版邏輯和特征抓取同樣表現(xiàn)出現(xiàn)。中文字體排版直接可用,分鏡邏輯清晰,連各家大模型的 Logo 特征,都能被它做成頗具網(wǎng)感的 IP 延展。
![]()
▲提示詞:給電影拯救計劃設(shè)計一張橫屏海報(雖然他不知道高司令的拯救計劃,但是選的幾個演員確實是大片演員)
![]()
▲提示詞:經(jīng)典漫畫書內(nèi)頁,包含分鏡格子、人物動態(tài)動作、對話氣泡
![]()
▲提示詞:生成一系列不同的 AI 大語言模型(Gemini、deepseek、ChatGPT、Claude、Grok 等)的表情包設(shè)計
過去設(shè)計師對齊需求時,找各種參考、搭復(fù)雜的設(shè)計框架、排版修字。現(xiàn)在,一段清晰簡單的提示詞進(jìn)去,一張可以直接用于商業(yè)提案、電商投放甚至直接出街的成品就出來了。
在我們測試過程中,無論是 Plus 賬號還是免費(fèi)賬號,都已經(jīng)上線了 GPT Image 2,大家可以在自己的 ChatGPT 對話框里試試。
不過,目前仍然會有速率限制的提示,當(dāng)我們頻繁發(fā)送提示詞,要求 ChatGPT 生成時,他會直接回復(fù)一段錯誤代碼,顯示「你的圖片生成速度太快了,為了保證所有人最好的體驗,我們有速率限制,請在 13 分鐘后生成。」
![]()
不得不說,每當(dāng)我們覺得 OpenAI 陷入停滯,它總能在你毫無防備的時候甩出一張新牌。
過去幾個月,外界吐槽它發(fā)新模型是擠牙膏、Sora 關(guān)閉、ChatGPT Atlas 瀏覽器爆冷,仿佛那個曾經(jīng)不可一世的 AI 霸主真的變菜了。
今天 GPT Image 2 的出現(xiàn),也算是給了這些唱衰一次有力的回應(yīng)。
![]()
當(dāng)一個模型能以假亂真地生成數(shù)學(xué)試卷、完整復(fù)刻抖音直播界面,「這是 AI 做的」我想很難是一眼能看穿的事了。
那個「有圖有真相」的時代,是真的回不去了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.