作者 | 小小
出品 | 網(wǎng)易科技
參數(shù)依舊華麗,但體驗(yàn)真的能打嗎?
![]()
在谷歌Nano Banana的步步緊逼下,高傲的OpenAI最終不得不選擇了“自降身價(jià)”。新版GPT-Image-1.5的上線(xiàn),雖然打出了4倍生成極速和“像素級(jí)”控制的王炸,更直接祭出了API端降價(jià)20%的肉搏戰(zhàn)術(shù),但這一切難掩其防御姿態(tài)的倉(cāng)促。
![]()
輿論場(chǎng)瞬間撕裂。務(wù)實(shí)派大贊其“畫(huà)質(zhì)出色、控制精準(zhǔn),適用于實(shí)際生產(chǎn)”,認(rèn)為這是工作流的福音;但權(quán)威專(zhuān)家卻冷冷地潑下一盆冷水:“在處理復(fù)雜視覺(jué)內(nèi)容時(shí),其表現(xiàn)可能仍不及競(jìng)品Nano Banana Pro。”
也有評(píng)論員尖銳地指出:當(dāng)OpenAI試圖用“軍備競(jìng)賽”的方式回應(yīng)競(jìng)爭(zhēng),它是否已經(jīng)忘記了當(dāng)初那個(gè)誓言要造出AGI的初心?當(dāng)科技巨頭們不再講故事,而是專(zhuān)注于“堆料”和“降價(jià)”時(shí),這究竟是技術(shù)的進(jìn)步,還是創(chuàng)新精神的淪陷?
帶著這些疑問(wèn),讓我們剝開(kāi)GPT-Image-1.5華麗的速度外衣,它到底強(qiáng)在哪里?又有哪些“隱形短板”仍舊困擾著這位視覺(jué)霸主?
![]()
(GPT-Image-1.5生成效果)
1. 硬核評(píng)測(cè):速度狂飆4倍,從“佛系等待”到“實(shí)時(shí)反饋”
ChatGPT Images這次的產(chǎn)品策略非常清晰:用極致的速度和精準(zhǔn)的控制力,直擊專(zhuān)業(yè)級(jí)用戶(hù)對(duì)效率與可控性的痛點(diǎn)。
![]()
(圖片由AI生成)
——“極速”能力的質(zhì)變:創(chuàng)作工作流的福音
如果你是重度創(chuàng)作者或營(yíng)銷(xiāo)人員,那么GPT-Image-1.5在速度上的進(jìn)化,無(wú)疑將成為你眼中的絕對(duì)主角。
官方數(shù)據(jù)顯示,新模型的生成速度最高直接飆升至原先的4倍!有網(wǎng)友評(píng)論稱(chēng),這是“自從Nano Banana發(fā)布以來(lái),AI圖像生成領(lǐng)域在模型排名上最大的飛躍!”
![]()
在追求實(shí)時(shí)交互和高效迭代的今天,這種速度的革命性意義在于:
· 并行創(chuàng)作:用戶(hù)可以在已有圖像生成的同時(shí),繼續(xù)發(fā)起新的創(chuàng)作請(qǐng)求,徹底消除“等待時(shí)間”。
· 降低試錯(cuò)成本:以前需要數(shù)分鐘的嘗試,現(xiàn)在可以在幾十秒內(nèi)完成多輪迭代,極大地提高了“試錯(cuò)效率”。
這種速度的提升,使得圖像生成從“被動(dòng)等待”轉(zhuǎn)向了近乎 “實(shí)時(shí)反饋”,為工作流的整合奠定了堅(jiān)實(shí)的基礎(chǔ)。
——獨(dú)立創(chuàng)作空間:用戶(hù)體驗(yàn)的顛覆性重構(gòu)
為了配合這種高速迭代的需求,OpenAI推出了獨(dú)立的Images創(chuàng)作空間,不再讓圖像功能僅僅是聊天窗口中的“附屬功能”。
![]()
(圖片由AI生成)
這個(gè)專(zhuān)屬的“創(chuàng)意工作室”內(nèi)置了多種預(yù)設(shè)濾鏡、持續(xù)更新的流行提示詞趨勢(shì)以及創(chuàng)意模板。此外,用戶(hù)還可以一次性上傳個(gè)人形象(肖像),用于后續(xù)重復(fù)創(chuàng)作,從而降低了重復(fù)描述的成本。正如OpenAI應(yīng)用負(fù)責(zé)人菲吉·西莫所說(shuō),新界面旨在讓圖像生成過(guò)程充滿(mǎn)樂(lè)趣,使創(chuàng)意探索變得毫不費(fèi)力。
![]()
——“精確編輯”的強(qiáng)悍實(shí)力:告別整體漂移
在具體的編輯應(yīng)用場(chǎng)景中,GPT-Image-1.5也有質(zhì)的飛躍:
![]()
(圖片由AI生成)
· 一致性保持(核心):它能更準(zhǔn)確地區(qū)分圖像中 “需要改變的部分” 與 “應(yīng)當(dāng)保持不變的部分”,并在內(nèi)部推理中“釘死”關(guān)鍵的視覺(jué)錨點(diǎn)。例如,你可以給人物換服裝、換發(fā)型,而人物的五官、面部特征和光照條件依然紋絲不動(dòng),大大提升了“試穿試戴”和“角色一致性”的實(shí)用價(jià)值。
![]()
· 指令遵循與文本渲染:模型在理解多約束、復(fù)雜組合要求時(shí)的穩(wěn)定性有所提升。同時(shí),它在文字渲染方面實(shí)現(xiàn)了進(jìn)一步增強(qiáng),能夠更清晰地呈現(xiàn)密集文本與小字號(hào)內(nèi)容,被視為圖像模型“邁向?qū)嵱没钡谋匾a(bǔ)課。
世界頂尖免疫學(xué)家德里亞·烏努特馬茲(Derya Unutmaz)用“驚艷”來(lái)形容使用體驗(yàn),特別稱(chēng)贊了ChatGPT Images在指令執(zhí)行的精準(zhǔn)度和圖像編輯的細(xì)致程度上的出色表現(xiàn)。
![]()
2. 深度挖掘:光鮮背后的“隱形短板”與行業(yè)焦慮
但我們不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的參數(shù)之下,也有一些值得警惕的短板和行業(yè)焦慮。
——技術(shù)“護(hù)城河”的消失與GPT-Image-1.5的定位
這是奧特曼“紅色警報(bào)”的核心原因之一。雖然OpenAI宣稱(chēng)GPT-Image-1.5在一致性方面有所突破,但行業(yè)現(xiàn)狀是:差距已經(jīng)微乎其微。
![]()
(圖片由AI生成)
谷歌Nano Banana Pro在精確編輯、背景移除等方面一直領(lǐng)先。Runway在視頻生成領(lǐng)域甚至反超了Sora。
有網(wǎng)友評(píng)論稱(chēng),將版本號(hào)定為1.5而非2.0,本身就暗示了OpenAI的謹(jǐn)慎態(tài)度:這是一次重要迭代而非代際革命。
![]()
曾經(jīng),OpenAI領(lǐng)先對(duì)手一年甚至兩年;現(xiàn)在,這個(gè)領(lǐng)先優(yōu)勢(shì)被壓縮到了幾周甚至幾天。圖像生成的底層范式已經(jīng)成為行業(yè)共識(shí),OpenAI不再擁有獨(dú)門(mén)秘籍。
——復(fù)雜構(gòu)圖與結(jié)構(gòu)化設(shè)計(jì)的挑戰(zhàn)
盡管模型在保持核心要素一致性上表現(xiàn)出色,但在面對(duì)復(fù)雜和結(jié)構(gòu)化任務(wù)時(shí),挑戰(zhàn)依然存在。
![]()
(圖片由AI生成)
沃頓商學(xué)院教授伊桑·莫利克(Ethan Mollick)認(rèn)為,在處理復(fù)雜視覺(jué)內(nèi)容(如多圖幻燈片、信息圖表等結(jié)構(gòu)化設(shè)計(jì))時(shí),ChatGPT Images的表現(xiàn)可能仍不及競(jìng)品Nano Banana Pro。
![]()
前OpenAI研究員邁爾斯·布倫迪奇(Miles Brundage)則吐槽道,當(dāng)提示詞過(guò)長(zhǎng)或過(guò)于復(fù)雜時(shí),ChatGPT Images可能無(wú)法完全理解并協(xié)調(diào)所有細(xì)節(jié),導(dǎo)致輸出結(jié)果看起來(lái)隨機(jī)或不準(zhǔn)確。
![]()
這說(shuō)明,模型在“抽象理解”和“多元素邏輯協(xié)調(diào)”上,仍未達(dá)到完美狀態(tài)。
——降本增效:商業(yè)突圍的布局
這次升級(jí)也是一場(chǎng)精明的商業(yè)突圍。
GPT-Image-1.5已通過(guò)API形式正式開(kāi)放,其最大的亮點(diǎn)在于:圖像輸入與輸出的整體成本降低了約20%! API定價(jià)為每百萬(wàn)輸入Token 8美元、每百萬(wàn)輸出Token 32美元。
![]()
(圖片由AI生成)
這對(duì)于預(yù)算有限的初創(chuàng)公司和電商企業(yè)來(lái)說(shuō),無(wú)疑是極大的利好。Wix、Canva等頭部企業(yè)已開(kāi)始集成該模型。
正如Wix AI研究與數(shù)據(jù)科學(xué)負(fù)責(zé)人希拉·加特(Hila Gat) 所言,GPT Image 1.5畫(huà)質(zhì)出色、控制精準(zhǔn),能準(zhǔn)確執(zhí)行編輯指令,支持端到端迭代,適用于實(shí)際生產(chǎn)。
![]()
3. 結(jié)語(yǔ):視覺(jué)時(shí)代的“王座守衛(wèi)戰(zhàn)”與創(chuàng)作自由的未來(lái)
GPT-Image-1.5的雙重進(jìn)化——速度狂飆與精度鎖定——再次向世界證明了 OpenAI在 AI基礎(chǔ)設(shè)施上的統(tǒng)治力。它不再滿(mǎn)足于當(dāng)一個(gè)偶爾靈光乍現(xiàn)的“藝術(shù)家”,而是立志成為每一個(gè)創(chuàng)意工作者案頭的“數(shù)字版Photoshop”。
但面對(duì)谷歌、Anthropic 等巨頭的步步緊逼,當(dāng)所有模型都在逼近人類(lèi)專(zhuān)家的水準(zhǔn)時(shí),“第一”的頭銜將變得越來(lái)越昂貴、也越來(lái)越脆弱。
OpenAI 的真正考驗(yàn),不再是能否跑贏對(duì)手,而是能否跨越自己設(shè)置的“商業(yè)化”門(mén)檻。
這場(chǎng)圖像能力的升級(jí),本質(zhì)上是 Open AI 為搶占 B 端市場(chǎng)、為未來(lái)高昂的算力支出買(mǎi)單而打出的一張效率牌和成本牌。它為用戶(hù)帶來(lái)了前所未有的創(chuàng)作自由,但同時(shí)也將 AI 競(jìng)賽推向了新的維度:誰(shuí)能將頂尖的能力,以最低的成本、最無(wú)縫的方式融入到企業(yè)和個(gè)人的每一個(gè)工作流程中,誰(shuí)才是真正的勝利者。
![]()
(圖片由AI生成)
而對(duì)于用戶(hù)而言,巨頭們的“軍備競(jìng)賽”卻是最大的福音。更強(qiáng)的模型、更低的價(jià)格、更順手的工具——這就是競(jìng)爭(zhēng)帶來(lái)的紅利。至于 GPT-Image-1.5能否真正終結(jié)比賽,答案不在參數(shù)表里,而在每一個(gè)創(chuàng)作者的鼠標(biāo)和鍵盤(pán)之上。
