網(wǎng)易首頁(yè) > 網(wǎng)易科技 > IT業(yè)界 > 正文

OpenAI新模型來(lái)了！4倍速、降價(jià)20%，網(wǎng)友卻嘆氣：還是輸給谷歌

2025-12-17 11:02:33　來(lái)源: 網(wǎng)易科技報(bào)道

北京舉報(bào)

分享至

作者 | 小小

出品 | 網(wǎng)易科技

參數(shù)依舊華麗，但體驗(yàn)真的能打嗎？

在谷歌Nano Banana的步步緊逼下，高傲的OpenAI最終不得不選擇了“自降身價(jià)”。新版GPT-Image-1.5的上線(xiàn)，雖然打出了4倍生成極速和“像素級(jí)”控制的王炸，更直接祭出了API端降價(jià)20%的肉搏戰(zhàn)術(shù)，但這一切難掩其防御姿態(tài)的倉(cāng)促。

輿論場(chǎng)瞬間撕裂。務(wù)實(shí)派大贊其“畫(huà)質(zhì)出色、控制精準(zhǔn)，適用于實(shí)際生產(chǎn)”，認(rèn)為這是工作流的福音；但權(quán)威專(zhuān)家卻冷冷地潑下一盆冷水：“在處理復(fù)雜視覺(jué)內(nèi)容時(shí)，其表現(xiàn)可能仍不及競(jìng)品Nano Banana Pro。”

也有評(píng)論員尖銳地指出：當(dāng)OpenAI試圖用“軍備競(jìng)賽”的方式回應(yīng)競(jìng)爭(zhēng)，它是否已經(jīng)忘記了當(dāng)初那個(gè)誓言要造出AGI的初心？當(dāng)科技巨頭們不再講故事，而是專(zhuān)注于“堆料”和“降價(jià)”時(shí)，這究竟是技術(shù)的進(jìn)步，還是創(chuàng)新精神的淪陷？

帶著這些疑問(wèn)，讓我們剝開(kāi)GPT-Image-1.5華麗的速度外衣，它到底強(qiáng)在哪里？又有哪些“隱形短板”仍舊困擾著這位視覺(jué)霸主？

（GPT-Image-1.5生成效果）

1. 硬核評(píng)測(cè)：速度狂飆4倍，從“佛系等待”到“實(shí)時(shí)反饋”

ChatGPT Images這次的產(chǎn)品策略非常清晰：用極致的速度和精準(zhǔn)的控制力，直擊專(zhuān)業(yè)級(jí)用戶(hù)對(duì)效率與可控性的痛點(diǎn)。

（圖片由AI生成）

——“極速”能力的質(zhì)變：創(chuàng)作工作流的福音

如果你是重度創(chuàng)作者或營(yíng)銷(xiāo)人員，那么GPT-Image-1.5在速度上的進(jìn)化，無(wú)疑將成為你眼中的絕對(duì)主角。

官方數(shù)據(jù)顯示，新模型的生成速度最高直接飆升至原先的4倍！有網(wǎng)友評(píng)論稱(chēng)，這是“自從Nano Banana發(fā)布以來(lái)，AI圖像生成領(lǐng)域在模型排名上最大的飛躍！”

在追求實(shí)時(shí)交互和高效迭代的今天，這種速度的革命性意義在于：

· 并行創(chuàng)作：用戶(hù)可以在已有圖像生成的同時(shí)，繼續(xù)發(fā)起新的創(chuàng)作請(qǐng)求，徹底消除“等待時(shí)間”。

· 降低試錯(cuò)成本：以前需要數(shù)分鐘的嘗試，現(xiàn)在可以在幾十秒內(nèi)完成多輪迭代，極大地提高了“試錯(cuò)效率”。

這種速度的提升，使得圖像生成從“被動(dòng)等待”轉(zhuǎn)向了近乎 “實(shí)時(shí)反饋”，為工作流的整合奠定了堅(jiān)實(shí)的基礎(chǔ)。

——獨(dú)立創(chuàng)作空間：用戶(hù)體驗(yàn)的顛覆性重構(gòu)

為了配合這種高速迭代的需求，OpenAI推出了獨(dú)立的Images創(chuàng)作空間，不再讓圖像功能僅僅是聊天窗口中的“附屬功能”。

（圖片由AI生成）

這個(gè)專(zhuān)屬的“創(chuàng)意工作室”內(nèi)置了多種預(yù)設(shè)濾鏡、持續(xù)更新的流行提示詞趨勢(shì)以及創(chuàng)意模板。此外，用戶(hù)還可以一次性上傳個(gè)人形象（肖像），用于后續(xù)重復(fù)創(chuàng)作，從而降低了重復(fù)描述的成本。正如OpenAI應(yīng)用負(fù)責(zé)人菲吉·西莫所說(shuō)，新界面旨在讓圖像生成過(guò)程充滿(mǎn)樂(lè)趣，使創(chuàng)意探索變得毫不費(fèi)力。

——“精確編輯”的強(qiáng)悍實(shí)力：告別整體漂移

在具體的編輯應(yīng)用場(chǎng)景中，GPT-Image-1.5也有質(zhì)的飛躍：

（圖片由AI生成）

· 一致性保持（核心）：它能更準(zhǔn)確地區(qū)分圖像中 “需要改變的部分” 與 “應(yīng)當(dāng)保持不變的部分”，并在內(nèi)部推理中“釘死”關(guān)鍵的視覺(jué)錨點(diǎn)。例如，你可以給人物換服裝、換發(fā)型，而人物的五官、面部特征和光照條件依然紋絲不動(dòng)，大大提升了“試穿試戴”和“角色一致性”的實(shí)用價(jià)值。

· 指令遵循與文本渲染：模型在理解多約束、復(fù)雜組合要求時(shí)的穩(wěn)定性有所提升。同時(shí)，它在文字渲染方面實(shí)現(xiàn)了進(jìn)一步增強(qiáng)，能夠更清晰地呈現(xiàn)密集文本與小字號(hào)內(nèi)容，被視為圖像模型“邁向?qū)嵱没钡谋匾a(bǔ)課。

世界頂尖免疫學(xué)家德里亞·烏努特馬茲（Derya Unutmaz）用“驚艷”來(lái)形容使用體驗(yàn)，特別稱(chēng)贊了ChatGPT Images在指令執(zhí)行的精準(zhǔn)度和圖像編輯的細(xì)致程度上的出色表現(xiàn)。

2. 深度挖掘：光鮮背后的“隱形短板”與行業(yè)焦慮

但我們不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的參數(shù)之下，也有一些值得警惕的短板和行業(yè)焦慮。

——技術(shù)“護(hù)城河”的消失與GPT-Image-1.5的定位

這是奧特曼“紅色警報(bào)”的核心原因之一。雖然OpenAI宣稱(chēng)GPT-Image-1.5在一致性方面有所突破，但行業(yè)現(xiàn)狀是：差距已經(jīng)微乎其微。

（圖片由AI生成）

谷歌Nano Banana Pro在精確編輯、背景移除等方面一直領(lǐng)先。Runway在視頻生成領(lǐng)域甚至反超了Sora。

有網(wǎng)友評(píng)論稱(chēng)，將版本號(hào)定為1.5而非2.0，本身就暗示了OpenAI的謹(jǐn)慎態(tài)度：這是一次重要迭代而非代際革命。

曾經(jīng)，OpenAI領(lǐng)先對(duì)手一年甚至兩年；現(xiàn)在，這個(gè)領(lǐng)先優(yōu)勢(shì)被壓縮到了幾周甚至幾天。圖像生成的底層范式已經(jīng)成為行業(yè)共識(shí)，OpenAI不再擁有獨(dú)門(mén)秘籍。

——復(fù)雜構(gòu)圖與結(jié)構(gòu)化設(shè)計(jì)的挑戰(zhàn)

盡管模型在保持核心要素一致性上表現(xiàn)出色，但在面對(duì)復(fù)雜和結(jié)構(gòu)化任務(wù)時(shí)，挑戰(zhàn)依然存在。

（圖片由AI生成）

沃頓商學(xué)院教授伊桑·莫利克（Ethan Mollick）認(rèn)為，在處理復(fù)雜視覺(jué)內(nèi)容（如多圖幻燈片、信息圖表等結(jié)構(gòu)化設(shè)計(jì)）時(shí)，ChatGPT Images的表現(xiàn)可能仍不及競(jìng)品Nano Banana Pro。

前OpenAI研究員邁爾斯·布倫迪奇（Miles Brundage）則吐槽道，當(dāng)提示詞過(guò)長(zhǎng)或過(guò)于復(fù)雜時(shí)，ChatGPT Images可能無(wú)法完全理解并協(xié)調(diào)所有細(xì)節(jié)，導(dǎo)致輸出結(jié)果看起來(lái)隨機(jī)或不準(zhǔn)確。

這說(shuō)明，模型在“抽象理解”和“多元素邏輯協(xié)調(diào)”上，仍未達(dá)到完美狀態(tài)。

——降本增效：商業(yè)突圍的布局

這次升級(jí)也是一場(chǎng)精明的商業(yè)突圍。

GPT-Image-1.5已通過(guò)API形式正式開(kāi)放，其最大的亮點(diǎn)在于：圖像輸入與輸出的整體成本降低了約20%！ API定價(jià)為每百萬(wàn)輸入Token 8美元、每百萬(wàn)輸出Token 32美元。

（圖片由AI生成）

這對(duì)于預(yù)算有限的初創(chuàng)公司和電商企業(yè)來(lái)說(shuō)，無(wú)疑是極大的利好。Wix、Canva等頭部企業(yè)已開(kāi)始集成該模型。

正如Wix AI研究與數(shù)據(jù)科學(xué)負(fù)責(zé)人希拉·加特（Hila Gat）所言，GPT Image 1.5畫(huà)質(zhì)出色、控制精準(zhǔn)，能準(zhǔn)確執(zhí)行編輯指令，支持端到端迭代，適用于實(shí)際生產(chǎn)。

3. 結(jié)語(yǔ)：視覺(jué)時(shí)代的“王座守衛(wèi)戰(zhàn)”與創(chuàng)作自由的未來(lái)

GPT-Image-1.5的雙重進(jìn)化——速度狂飆與精度鎖定——再次向世界證明了 OpenAI在 AI基礎(chǔ)設(shè)施上的統(tǒng)治力。它不再滿(mǎn)足于當(dāng)一個(gè)偶爾靈光乍現(xiàn)的“藝術(shù)家”，而是立志成為每一個(gè)創(chuàng)意工作者案頭的“數(shù)字版Photoshop”。

但面對(duì)谷歌、Anthropic 等巨頭的步步緊逼，當(dāng)所有模型都在逼近人類(lèi)專(zhuān)家的水準(zhǔn)時(shí)，“第一”的頭銜將變得越來(lái)越昂貴、也越來(lái)越脆弱。

OpenAI 的真正考驗(yàn)，不再是能否跑贏對(duì)手，而是能否跨越自己設(shè)置的“商業(yè)化”門(mén)檻。

這場(chǎng)圖像能力的升級(jí)，本質(zhì)上是 Open AI 為搶占 B 端市場(chǎng)、為未來(lái)高昂的算力支出買(mǎi)單而打出的一張效率牌和成本牌。它為用戶(hù)帶來(lái)了前所未有的創(chuàng)作自由，但同時(shí)也將 AI 競(jìng)賽推向了新的維度：誰(shuí)能將頂尖的能力，以最低的成本、最無(wú)縫的方式融入到企業(yè)和個(gè)人的每一個(gè)工作流程中，誰(shuí)才是真正的勝利者。

（圖片由AI生成）

而對(duì)于用戶(hù)而言，巨頭們的“軍備競(jìng)賽”卻是最大的福音。更強(qiáng)的模型、更低的價(jià)格、更順手的工具——這就是競(jìng)爭(zhēng)帶來(lái)的紅利。至于 GPT-Image-1.5能否真正終結(jié)比賽，答案不在參數(shù)表里，而在每一個(gè)創(chuàng)作者的鼠標(biāo)和鍵盤(pán)之上。