網易首頁 > 網易科技 > IT業(yè)界 > 正文

OpenAI新模型來了！4倍速、降價20%，網友卻嘆氣：還是輸給谷歌

2025-12-17 11:02:33　來源: 網易科技報道

北京舉報

分享至

作者 | 小小

出品 | 網易科技

參數(shù)依舊華麗，但體驗真的能打嗎？

在谷歌Nano Banana的步步緊逼下，高傲的OpenAI最終不得不選擇了“自降身價”。新版GPT-Image-1.5的上線，雖然打出了4倍生成極速和“像素級”控制的王炸，更直接祭出了API端降價20%的肉搏戰(zhàn)術，但這一切難掩其防御姿態(tài)的倉促。

輿論場瞬間撕裂。務實派大贊其“畫質出色、控制精準，適用于實際生產”，認為這是工作流的福音；但權威專家卻冷冷地潑下一盆冷水：“在處理復雜視覺內容時，其表現(xiàn)可能仍不及競品Nano Banana Pro。”

也有評論員尖銳地指出：當OpenAI試圖用“軍備競賽”的方式回應競爭，它是否已經忘記了當初那個誓言要造出AGI的初心？當科技巨頭們不再講故事，而是專注于“堆料”和“降價”時，這究竟是技術的進步，還是創(chuàng)新精神的淪陷？

帶著這些疑問，讓我們剝開GPT-Image-1.5華麗的速度外衣，它到底強在哪里？又有哪些“隱形短板”仍舊困擾著這位視覺霸主？

（GPT-Image-1.5生成效果）

1. 硬核評測：速度狂飆4倍，從“佛系等待”到“實時反饋”

ChatGPT Images這次的產品策略非常清晰：用極致的速度和精準的控制力，直擊專業(yè)級用戶對效率與可控性的痛點。

（圖片由AI生成）

——“極速”能力的質變：創(chuàng)作工作流的福音

如果你是重度創(chuàng)作者或營銷人員，那么GPT-Image-1.5在速度上的進化，無疑將成為你眼中的絕對主角。

官方數(shù)據(jù)顯示，新模型的生成速度最高直接飆升至原先的4倍！有網友評論稱，這是“自從Nano Banana發(fā)布以來，AI圖像生成領域在模型排名上最大的飛躍！”

在追求實時交互和高效迭代的今天，這種速度的革命性意義在于：

· 并行創(chuàng)作：用戶可以在已有圖像生成的同時，繼續(xù)發(fā)起新的創(chuàng)作請求，徹底消除“等待時間”。

· 降低試錯成本：以前需要數(shù)分鐘的嘗試，現(xiàn)在可以在幾十秒內完成多輪迭代，極大地提高了“試錯效率”。

這種速度的提升，使得圖像生成從“被動等待”轉向了近乎 “實時反饋”，為工作流的整合奠定了堅實的基礎。

——獨立創(chuàng)作空間：用戶體驗的顛覆性重構

為了配合這種高速迭代的需求，OpenAI推出了獨立的Images創(chuàng)作空間，不再讓圖像功能僅僅是聊天窗口中的“附屬功能”。

（圖片由AI生成）

這個專屬的“創(chuàng)意工作室”內置了多種預設濾鏡、持續(xù)更新的流行提示詞趨勢以及創(chuàng)意模板。此外，用戶還可以一次性上傳個人形象（肖像），用于后續(xù)重復創(chuàng)作，從而降低了重復描述的成本。正如OpenAI應用負責人菲吉·西莫所說，新界面旨在讓圖像生成過程充滿樂趣，使創(chuàng)意探索變得毫不費力。

——“精確編輯”的強悍實力：告別整體漂移

在具體的編輯應用場景中，GPT-Image-1.5也有質的飛躍：

（圖片由AI生成）

· 一致性保持（核心）：它能更準確地區(qū)分圖像中 “需要改變的部分” 與 “應當保持不變的部分”，并在內部推理中“釘死”關鍵的視覺錨點。例如，你可以給人物換服裝、換發(fā)型，而人物的五官、面部特征和光照條件依然紋絲不動，大大提升了“試穿試戴”和“角色一致性”的實用價值。

· 指令遵循與文本渲染：模型在理解多約束、復雜組合要求時的穩(wěn)定性有所提升。同時，它在文字渲染方面實現(xiàn)了進一步增強，能夠更清晰地呈現(xiàn)密集文本與小字號內容，被視為圖像模型“邁向實用化”的必要補課。

世界頂尖免疫學家德里亞·烏努特馬茲（Derya Unutmaz）用“驚艷”來形容使用體驗，特別稱贊了ChatGPT Images在指令執(zhí)行的精準度和圖像編輯的細致程度上的出色表現(xiàn)。

2. 深度挖掘：光鮮背后的“隱形短板”與行業(yè)焦慮

但我們不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的參數(shù)之下，也有一些值得警惕的短板和行業(yè)焦慮。

——技術“護城河”的消失與GPT-Image-1.5的定位

這是奧特曼“紅色警報”的核心原因之一。雖然OpenAI宣稱GPT-Image-1.5在一致性方面有所突破，但行業(yè)現(xiàn)狀是：差距已經微乎其微。

（圖片由AI生成）

谷歌Nano Banana Pro在精確編輯、背景移除等方面一直領先。Runway在視頻生成領域甚至反超了Sora。

有網友評論稱，將版本號定為1.5而非2.0，本身就暗示了OpenAI的謹慎態(tài)度：這是一次重要迭代而非代際革命。

曾經，OpenAI領先對手一年甚至兩年；現(xiàn)在，這個領先優(yōu)勢被壓縮到了幾周甚至幾天。圖像生成的底層范式已經成為行業(yè)共識，OpenAI不再擁有獨門秘籍。

——復雜構圖與結構化設計的挑戰(zhàn)

盡管模型在保持核心要素一致性上表現(xiàn)出色，但在面對復雜和結構化任務時，挑戰(zhàn)依然存在。

（圖片由AI生成）

沃頓商學院教授伊桑·莫利克（Ethan Mollick）認為，在處理復雜視覺內容（如多圖幻燈片、信息圖表等結構化設計）時，ChatGPT Images的表現(xiàn)可能仍不及競品Nano Banana Pro。

前OpenAI研究員邁爾斯·布倫迪奇（Miles Brundage）則吐槽道，當提示詞過長或過于復雜時，ChatGPT Images可能無法完全理解并協(xié)調所有細節(jié)，導致輸出結果看起來隨機或不準確。

這說明，模型在“抽象理解”和“多元素邏輯協(xié)調”上，仍未達到完美狀態(tài)。

——降本增效：商業(yè)突圍的布局

這次升級也是一場精明的商業(yè)突圍。

GPT-Image-1.5已通過API形式正式開放，其最大的亮點在于：圖像輸入與輸出的整體成本降低了約20%！ API定價為每百萬輸入Token 8美元、每百萬輸出Token 32美元。

（圖片由AI生成）

這對于預算有限的初創(chuàng)公司和電商企業(yè)來說，無疑是極大的利好。Wix、Canva等頭部企業(yè)已開始集成該模型。

正如Wix AI研究與數(shù)據(jù)科學負責人希拉·加特（Hila Gat）所言，GPT Image 1.5畫質出色、控制精準，能準確執(zhí)行編輯指令，支持端到端迭代，適用于實際生產。

3. 結語：視覺時代的“王座守衛(wèi)戰(zhàn)”與創(chuàng)作自由的未來

GPT-Image-1.5的雙重進化——速度狂飆與精度鎖定——再次向世界證明了 OpenAI在 AI基礎設施上的統(tǒng)治力。它不再滿足于當一個偶爾靈光乍現(xiàn)的“藝術家”，而是立志成為每一個創(chuàng)意工作者案頭的“數(shù)字版Photoshop”。

但面對谷歌、Anthropic 等巨頭的步步緊逼，當所有模型都在逼近人類專家的水準時，“第一”的頭銜將變得越來越昂貴、也越來越脆弱。

OpenAI 的真正考驗，不再是能否跑贏對手，而是能否跨越自己設置的“商業(yè)化”門檻。

這場圖像能力的升級，本質上是 Open AI 為搶占 B 端市場、為未來高昂的算力支出買單而打出的一張效率牌和成本牌。它為用戶帶來了前所未有的創(chuàng)作自由，但同時也將 AI 競賽推向了新的維度：誰能將頂尖的能力，以最低的成本、最無縫的方式融入到企業(yè)和個人的每一個工作流程中，誰才是真正的勝利者。