![]()
美國(guó)時(shí)間12 月 16 日,OpenAI 正式更新了ChatGPT Images:ChatGPT 里的生圖/改圖體驗(yàn)被整體重做,并由新的旗艦圖像模型驅(qū)動(dòng);同時(shí),開(kāi)發(fā)者側(cè)在 API 里也拿到了同款模型——GPT Image 1.5。
這次更新的一個(gè)微妙之處在于:官方敘事是“更快、更準(zhǔn)、更能改”,但社交平臺(tái)上最出圈的吐槽卻是——“像 Nano Banana Pro,但像是低配版”。(尤其是當(dāng)你把兩家模型拉到同一套“實(shí)戰(zhàn)用例”里硬剛時(shí)。)
1
01|官方到底發(fā)布了什么?一句話抓住主線
OpenAI 的說(shuō)法很直接:你不管是從零生成,還是對(duì)照片做局部編輯,都應(yīng)該更接近你腦子里想的那個(gè)結(jié)果;并且生成速度最高可達(dá) 4 倍提升。官方強(qiáng)調(diào)的能力點(diǎn),核心就三條:
- 更“”的編輯:改哪里,就改哪里;盡量保持光照、構(gòu)圖、人物外觀一致,適合做換裝、換背景、風(fēng)格化改造,以及多輪迭代編輯。
- 更強(qiáng)指令遵循:復(fù)雜提示詞里物體關(guān)系/位置關(guān)系更容易被“照著做”(官方拿 6×6 網(wǎng)格排列做了展示)。
- 文本渲染更可用:密集、小字號(hào)文本的可讀性更好,官方甚至展示了把一段 Markdown “排成報(bào)紙版面”的例子。
產(chǎn)品形態(tài)上也有變化:ChatGPT 里新增了更明確的Images 創(chuàng)作空間/入口(偏“作品流”),并且這套體驗(yàn)直接面向全體用戶發(fā)布,Business/Enterprise 稍后接入。
1
02|API 側(cè):開(kāi)發(fā)者拿到的“GPT Image 1.5”是什么形態(tài)?
在 OpenAI API 文檔里,圖像生成/編輯被放在 Images 能力下:你可以做“生成(generation)”或“編輯(edit)”,并通過(guò)參數(shù)控制輸出格式等。
而在 OpenAI Developer Community 的公告里,官方給 GPT Image 1.5 的定位同樣是三件事:更精確編輯(尤其是 logo/人臉保真)、更強(qiáng)指令遵循、更好的文本渲染。
價(jià)格層面,OpenAI 在官方發(fā)布文中只給了一個(gè)關(guān)鍵信號(hào):API的圖片輸入/輸出成本相對(duì)上一代(GPT Image 1)下調(diào)約 20%。
1
03|被吐槽“低配版 Nano Banana Pro”三到四個(gè)“實(shí)測(cè)對(duì)比”最扎心的點(diǎn)
下面挑了幾個(gè)在社區(qū)里傳播度高、且更貼近日常工作流的案例以及我們自己的實(shí)測(cè)給大家看下真實(shí)的效果。
案例 1:寫實(shí)照片質(zhì)感——GPT Image 1.5 仍然更“像 AI”,Nano Banana Pro 更“像手機(jī)拍的”
對(duì)比網(wǎng)站 Pablo 做了一組“手機(jī)攝影感(iPhone photo)”寫實(shí)測(cè)試,結(jié)論非常直白:在這一項(xiàng)里Nano Banana Pro 明顯更像真實(shí)照片,而 GPT Image 1.5 仍帶有較明顯的“AI 生成觀感”。
提示: 洛杉磯風(fēng)景滑板拍攝,采用以下風(fēng)格:90 年代末紀(jì)錄片街頭攝影風(fēng)格,使用 35mm 彩色膠片拍攝,配備徠卡 M 式取景相機(jī)和 35mm 鏡頭,柯達(dá) Portra 400 色彩調(diào)色,自然日光,柔和對(duì)比度,柔和逼真的色彩,嵌入膠片顆粒感,輕微邊緣柔化,觀察性自然構(gòu)圖,無(wú) HDR,無(wú)現(xiàn)代數(shù)字銳度,無(wú)電影燈光
這類差異在廣告圖、產(chǎn)品圖、頭像寫真這種“質(zhì)感優(yōu)先”的場(chǎng)景里,往往比“能不能生成”更關(guān)鍵——因?yàn)槟悴蝗币粡垐D,你缺的是“看起來(lái)就能直接用”的那張圖。
案例 2:生成速度——同等輸出下 Nano Banana Pro 更快,GPT Image 1.5 仍偏慢
有開(kāi)發(fā)者在公開(kāi)討論里提到類似體感:Nano Banana Pro 生成速度大約快 2×,而 GPT Image 1.5 雖然比上一代更快,但仍然“偏慢”。
我自己實(shí)測(cè)了一下,在Gemini里面用Nano Banana Pro生成同一張海報(bào),快速模式和思考模式下生成速度都比GPT Image更快。
GPT Image 1.5
Nano Banana快速版
Nano Banana Pro思考版
案例3:Markdown 報(bào)紙排版:測(cè)“文本渲染 + 格式保真”(對(duì)照 Nano Banana Pro)
OpenAI 在 GPT Image 1.5 的更新中,重點(diǎn)強(qiáng)化了兩項(xiàng)能力:一是對(duì)更密集、更小字號(hào)文本的可讀性提升;二是對(duì)復(fù)雜指令與版式結(jié)構(gòu)的更強(qiáng)遵循。我們直接復(fù)用了 OpenAI 的“Markdown 報(bào)紙排版”官方示例,分別在 GPT Image 1.5 與 Nano Banana Pro 上做了同題對(duì)測(cè)。
結(jié)果出乎意料地接近:在同樣的提示詞與版式要求下,Nano Banana Pro 在排版穩(wěn)定性、文字清晰度、字符準(zhǔn)確率上并不遜于 GPT 的官方樣例。更進(jìn)一步,我們還在 Nano Banana Pro 的測(cè)試?yán)镱~外加入了中文內(nèi)容(更容易暴露字體渲染與斷行問(wèn)題的“難題項(xiàng)”),整體呈現(xiàn)依然穩(wěn)定:小字可讀、符號(hào)不亂飄、層級(jí)結(jié)構(gòu)不容易被“重寫”。
這也意味著,至少在“文本渲染 + 格式保真”這一核心升級(jí)點(diǎn)上,Nano Banana Pro 已經(jīng)具備與 GPT Image 1.5 正面對(duì)打的能力。
![]()
GPT Image 1.5官方案例
中文版Nano Banana Pro
英文版Nano Banana Pro
1
04|一句結(jié)論:OpenAI 這次補(bǔ)的是“可用性”,而 Nano Banana Pro 依然勝在“Pro 感”
把兩邊的產(chǎn)品氣質(zhì)翻譯成人話,大概是:
- GPT Image 1.5:更像“ChatGPT 里自帶的改圖搭子”——強(qiáng)調(diào)多輪編輯、文本排版、指令遵循與一致性,且入口更順手。
- Nano Banana Pro:更像“專業(yè)素材生產(chǎn)機(jī)”——在寫實(shí)質(zhì)感、畫(huà)幅自由度、速度等“生產(chǎn)指標(biāo)”上更占優(yōu)勢(shì)(所以才會(huì)被調(diào)侃成“Pro 版”)。
網(wǎng)友們吐槽的“低配版 Nano Banana Pro”,本質(zhì)是在說(shuō):OpenAI 這次確實(shí)追上了一個(gè)大方向,但在若干硬指標(biāo)上,還沒(méi)把“Pro 的門檻”跨過(guò)去。
1
05|你做內(nèi)容/設(shè)計(jì),到底該怎么選?
你要的是短時(shí)間出大量可直接投放的寫實(shí)圖、封面圖、寬畫(huà)幅素材:優(yōu)先考慮 Nano Banana Pro 的工作流。
你要的是在同一張圖上反復(fù)改、要保留人物/構(gòu)圖一致性、還要做信息圖/文字排版:GPT Image 1.5 的“編輯取向”會(huì)更順。
點(diǎn)個(gè)“愛(ài)心”,再走 吧
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.