OpenAI今日正式推出全新圖像生成模型gpt-image-1.5,明確瞄準Google Gemini體系下備受關注的Nano Banana系列,以提升在AI圖像生成領域的競爭力。這一新模型將同時面向開發者和普通用戶開放,并全面接管ChatGPT中的圖像生成功能。
![]()
今年3月,OpenAI曾為Chatgpt的圖像生成功能帶來一次重大升級,新模型一經上線便迅速走紅,一周內用戶便在ChatGPT中生成了超過7億張圖片。隨后在4月,OpenAI通過發布gpt-image-1接口,將同一代圖像技術開放給開發者使用,使其能夠在各類應用和服務中集成圖像生成能力。
不過,在9月登場的GoogleGemini Nano Banana模型迅速搶占話題與市場,借由更強的圖像生成和編輯表現,大幅拉升了Gemini的用戶覆蓋。Nano Banana被認為在畫面質量和編輯靈活性方面全面領先gpt-image-1,并獲得全球開發者的廣泛采用。上個月,Google又在此基礎上推出Gemini 3 Pro Image(代號Nano Banana Pro),借助Gemini在推理與現實世界知識上的優勢,進一步提升生成圖像的準確性與一致性。
在這樣的背景下推出的gpt-image-1.5,被OpenAI視為正面對標Gemini Nano Banana系列的新一代核心產品。新模型在圖像編輯的精細度、品牌Logo和人臉等關鍵元素的保真度方面都有明顯提升,同時在理解和執行用戶指令方面也更為精準。OpenAI還強調,新模型在處理圖像中文字時有顯著增強,尤其是在密集文本和小字號文本的清晰度與正確性上。
對開發者而言,成本優化是gpt-image-1.5的一大亮點:與上一代gpt-image-1相比,新模型在圖像輸入與輸出的計費上便宜約20%。開發者依舊可以通過quality參數精細控制生成成本,而OpenAI聲稱,即便在較低質量設置下,新模型仍能保持相當強的生成效果。
面向普通用戶,gpt-image-1.5已經成為ChatGPT內置圖像生成體驗的底層引擎。OpenAI表示,該模型可以在保持光線、構圖和人物特征等細節基本不變的前提下,進行精準編輯,相較上一代實現最多4倍的性能提升,生成與編輯響應速度更快。
配合新模型,OpenAI還在ChatGPT中上線了全新的“Images”圖像專區,已在移動應用和網頁版同步開放。用戶可在該專區中使用預設濾鏡與提示詞快速上手圖像生成,這些預設會定期更新,以跟隨最新的創意風格與流行趨勢。OpenAI表示,新的圖像生成模型及ChatGPT Images體驗將向所有ChatGPT用戶逐步推送,未來將繼續圍繞易用性與創作效率進行迭代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.