作者 | 小小
出品 | 網易科技
參數(shù)依舊華麗,但體驗真的能打嗎?
![]()
在谷歌Nano Banana的步步緊逼下,高傲的OpenAI最終不得不選擇了“自降身價”。新版GPT-Image-1.5的上線,雖然打出了4倍生成極速和“像素級”控制的王炸,更直接祭出了API端降價20%的肉搏戰(zhàn)術,但這一切難掩其防御姿態(tài)的倉促。
![]()
輿論場瞬間撕裂。務實派大贊其“畫質出色、控制精準,適用于實際生產”,認為這是工作流的福音;但權威專家卻冷冷地潑下一盆冷水:“在處理復雜視覺內容時,其表現(xiàn)可能仍不及競品Nano Banana Pro。”
也有評論員尖銳地指出:當OpenAI試圖用“軍備競賽”的方式回應競爭,它是否已經忘記了當初那個誓言要造出AGI的初心?當科技巨頭們不再講故事,而是專注于“堆料”和“降價”時,這究竟是技術的進步,還是創(chuàng)新精神的淪陷?
帶著這些疑問,讓我們剝開GPT-Image-1.5華麗的速度外衣,它到底強在哪里?又有哪些“隱形短板”仍舊困擾著這位視覺霸主?
![]()
(GPT-Image-1.5生成效果)
1. 硬核評測:速度狂飆4倍,從“佛系等待”到“實時反饋”
ChatGPT Images這次的產品策略非常清晰:用極致的速度和精準的控制力,直擊專業(yè)級用戶對效率與可控性的痛點。
![]()
(圖片由AI生成)
——“極速”能力的質變:創(chuàng)作工作流的福音
如果你是重度創(chuàng)作者或營銷人員,那么GPT-Image-1.5在速度上的進化,無疑將成為你眼中的絕對主角。
官方數(shù)據(jù)顯示,新模型的生成速度最高直接飆升至原先的4倍!有網友評論稱,這是“自從Nano Banana發(fā)布以來,AI圖像生成領域在模型排名上最大的飛躍!”
![]()
在追求實時交互和高效迭代的今天,這種速度的革命性意義在于:
· 并行創(chuàng)作:用戶可以在已有圖像生成的同時,繼續(xù)發(fā)起新的創(chuàng)作請求,徹底消除“等待時間”。
· 降低試錯成本:以前需要數(shù)分鐘的嘗試,現(xiàn)在可以在幾十秒內完成多輪迭代,極大地提高了“試錯效率”。
這種速度的提升,使得圖像生成從“被動等待”轉向了近乎 “實時反饋”,為工作流的整合奠定了堅實的基礎。
——獨立創(chuàng)作空間:用戶體驗的顛覆性重構
為了配合這種高速迭代的需求,OpenAI推出了獨立的Images創(chuàng)作空間,不再讓圖像功能僅僅是聊天窗口中的“附屬功能”。
![]()
(圖片由AI生成)
這個專屬的“創(chuàng)意工作室”內置了多種預設濾鏡、持續(xù)更新的流行提示詞趨勢以及創(chuàng)意模板。此外,用戶還可以一次性上傳個人形象(肖像),用于后續(xù)重復創(chuàng)作,從而降低了重復描述的成本。正如OpenAI應用負責人菲吉·西莫所說,新界面旨在讓圖像生成過程充滿樂趣,使創(chuàng)意探索變得毫不費力。
![]()
——“精確編輯”的強悍實力:告別整體漂移
在具體的編輯應用場景中,GPT-Image-1.5也有質的飛躍:
![]()
(圖片由AI生成)
· 一致性保持(核心):它能更準確地區(qū)分圖像中 “需要改變的部分” 與 “應當保持不變的部分”,并在內部推理中“釘死”關鍵的視覺錨點。例如,你可以給人物換服裝、換發(fā)型,而人物的五官、面部特征和光照條件依然紋絲不動,大大提升了“試穿試戴”和“角色一致性”的實用價值。
![]()
· 指令遵循與文本渲染:模型在理解多約束、復雜組合要求時的穩(wěn)定性有所提升。同時,它在文字渲染方面實現(xiàn)了進一步增強,能夠更清晰地呈現(xiàn)密集文本與小字號內容,被視為圖像模型“邁向實用化”的必要補課。
世界頂尖免疫學家德里亞·烏努特馬茲(Derya Unutmaz)用“驚艷”來形容使用體驗,特別稱贊了ChatGPT Images在指令執(zhí)行的精準度和圖像編輯的細致程度上的出色表現(xiàn)。
![]()
2. 深度挖掘:光鮮背后的“隱形短板”與行業(yè)焦慮
但我們不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的參數(shù)之下,也有一些值得警惕的短板和行業(yè)焦慮。
——技術“護城河”的消失與GPT-Image-1.5的定位
這是奧特曼“紅色警報”的核心原因之一。雖然OpenAI宣稱GPT-Image-1.5在一致性方面有所突破,但行業(yè)現(xiàn)狀是:差距已經微乎其微。
![]()
(圖片由AI生成)
谷歌Nano Banana Pro在精確編輯、背景移除等方面一直領先。Runway在視頻生成領域甚至反超了Sora。
有網友評論稱,將版本號定為1.5而非2.0,本身就暗示了OpenAI的謹慎態(tài)度:這是一次重要迭代而非代際革命。
![]()
曾經,OpenAI領先對手一年甚至兩年;現(xiàn)在,這個領先優(yōu)勢被壓縮到了幾周甚至幾天。圖像生成的底層范式已經成為行業(yè)共識,OpenAI不再擁有獨門秘籍。
——復雜構圖與結構化設計的挑戰(zhàn)
盡管模型在保持核心要素一致性上表現(xiàn)出色,但在面對復雜和結構化任務時,挑戰(zhàn)依然存在。
![]()
(圖片由AI生成)
沃頓商學院教授伊桑·莫利克(Ethan Mollick)認為,在處理復雜視覺內容(如多圖幻燈片、信息圖表等結構化設計)時,ChatGPT Images的表現(xiàn)可能仍不及競品Nano Banana Pro。
![]()
前OpenAI研究員邁爾斯·布倫迪奇(Miles Brundage)則吐槽道,當提示詞過長或過于復雜時,ChatGPT Images可能無法完全理解并協(xié)調所有細節(jié),導致輸出結果看起來隨機或不準確。
![]()
這說明,模型在“抽象理解”和“多元素邏輯協(xié)調”上,仍未達到完美狀態(tài)。
——降本增效:商業(yè)突圍的布局
這次升級也是一場精明的商業(yè)突圍。
GPT-Image-1.5已通過API形式正式開放,其最大的亮點在于:圖像輸入與輸出的整體成本降低了約20%! API定價為每百萬輸入Token 8美元、每百萬輸出Token 32美元。
![]()
(圖片由AI生成)
這對于預算有限的初創(chuàng)公司和電商企業(yè)來說,無疑是極大的利好。Wix、Canva等頭部企業(yè)已開始集成該模型。
正如Wix AI研究與數(shù)據(jù)科學負責人希拉·加特(Hila Gat) 所言,GPT Image 1.5畫質出色、控制精準,能準確執(zhí)行編輯指令,支持端到端迭代,適用于實際生產。
![]()
3. 結語:視覺時代的“王座守衛(wèi)戰(zhàn)”與創(chuàng)作自由的未來
GPT-Image-1.5的雙重進化——速度狂飆與精度鎖定——再次向世界證明了 OpenAI在 AI基礎設施上的統(tǒng)治力。它不再滿足于當一個偶爾靈光乍現(xiàn)的“藝術家”,而是立志成為每一個創(chuàng)意工作者案頭的“數(shù)字版Photoshop”。
但面對谷歌、Anthropic 等巨頭的步步緊逼,當所有模型都在逼近人類專家的水準時,“第一”的頭銜將變得越來越昂貴、也越來越脆弱。
OpenAI 的真正考驗,不再是能否跑贏對手,而是能否跨越自己設置的“商業(yè)化”門檻。
這場圖像能力的升級,本質上是 Open AI 為搶占 B 端市場、為未來高昂的算力支出買單而打出的一張效率牌和成本牌。它為用戶帶來了前所未有的創(chuàng)作自由,但同時也將 AI 競賽推向了新的維度:誰能將頂尖的能力,以最低的成本、最無縫的方式融入到企業(yè)和個人的每一個工作流程中,誰才是真正的勝利者。
![]()
(圖片由AI生成)
而對于用戶而言,巨頭們的“軍備競賽”卻是最大的福音。更強的模型、更低的價格、更順手的工具——這就是競爭帶來的紅利。至于 GPT-Image-1.5能否真正終結比賽,答案不在參數(shù)表里,而在每一個創(chuàng)作者的鼠標和鍵盤之上。
