網易首頁 > 網易號 > 正文申請入駐

OpenAI發布新一代圖像模型gpt-image-1.5

2025-12-17 04:08:04　來源: cnBeta.COM

浙江舉報

分享至

OpenAI今日正式推出全新圖像生成模型gpt-image-1.5，明確瞄準Google Gemini體系下備受關注的Nano Banana系列，以提升在AI圖像生成領域的競爭力。這一新模型將同時面向開發者和普通用戶開放，并全面接管ChatGPT中的圖像生成功能。

今年3月，OpenAI曾為Chatgpt的圖像生成功能帶來一次重大升級，新模型一經上線便迅速走紅，一周內用戶便在ChatGPT中生成了超過7億張圖片。隨后在4月，OpenAI通過發布gpt-image-1接口，將同一代圖像技術開放給開發者使用，使其能夠在各類應用和服務中集成圖像生成能力。

不過，在9月登場的GoogleGemini Nano Banana模型迅速搶占話題與市場，借由更強的圖像生成和編輯表現，大幅拉升了Gemini的用戶覆蓋。Nano Banana被認為在畫面質量和編輯靈活性方面全面領先gpt-image-1，并獲得全球開發者的廣泛采用。上個月，Google又在此基礎上推出Gemini 3 Pro Image（代號Nano Banana Pro），借助Gemini在推理與現實世界知識上的優勢，進一步提升生成圖像的準確性與一致性。

在這樣的背景下推出的gpt-image-1.5，被OpenAI視為正面對標Gemini Nano Banana系列的新一代核心產品。新模型在圖像編輯的精細度、品牌Logo和人臉等關鍵元素的保真度方面都有明顯提升，同時在理解和執行用戶指令方面也更為精準。OpenAI還強調，新模型在處理圖像中文字時有顯著增強，尤其是在密集文本和小字號文本的清晰度與正確性上。

對開發者而言，成本優化是gpt-image-1.5的一大亮點：與上一代gpt-image-1相比，新模型在圖像輸入與輸出的計費上便宜約20%。開發者依舊可以通過quality參數精細控制生成成本，而OpenAI聲稱，即便在較低質量設置下，新模型仍能保持相當強的生成效果。

面向普通用戶，gpt-image-1.5已經成為ChatGPT內置圖像生成體驗的底層引擎。OpenAI表示，該模型可以在保持光線、構圖和人物特征等細節基本不變的前提下，進行精準編輯，相較上一代實現最多4倍的性能提升，生成與編輯響應速度更快。

配合新模型，OpenAI還在ChatGPT中上線了全新的“Images”圖像專區，已在移動應用和網頁版同步開放。用戶可在該專區中使用預設濾鏡與提示詞快速上手圖像生成，這些預設會定期更新，以跟隨最新的創意風格與流行趨勢。OpenAI表示，新的圖像生成模型及ChatGPT Images體驗將向所有ChatGPT用戶逐步推送，未來將繼續圍繞易用性與創作效率進行迭代。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.