財聯社12月17日訊(編輯 史正丞)OpenAI與谷歌的世界頂級AI應用之戰,又展開新一輪攻防。
北京時間周三凌晨,OpenAI宣布推出新版ChatGPT圖像功能,除了圖像生成質量更好、生成速度更快外,新版Images 模型在圖像編輯的精確性方面也迎來重要進步。可以說,OpenAI不僅向谷歌備受贊譽的Nano Banana系列模型發起反擊,還順勢踢了一腳Photoshop的“飯碗”。
![]()
OpenAI介紹稱,基于最新旗艦圖像生成模型的“ChatGPT圖像”功能,能夠在保持細節完整的同時進行精確編輯,更有可能呈現出用戶希望看到的效果。在保持細節完整的同時進行精確編輯,生成速度提升至多4倍。
當然,圖像生成模型的效果,得用圖像來說明。
作為此次升級的最關鍵提升,OpenAI介紹稱,新模型擅長多種類型的精確編輯,包括添加、刪除、合并、混合和轉置,在獲取修圖效果的同時,保留圖片本身的特點。
舉例而言,以下是ChatGPT新圖像模型生成的90年代末的洛杉磯街頭攝影(演示版)。
![]()
→把人物的襯衫改成紅色,帽子改成黃色,限速改為15,卡車改成消防車;
![]()
→在左側加一群觀看的人,右側人行道上棲著一只鷹,遠處有一只飛船在天空中飛過;
![]()
→帶有該圖像全包印花的T恤掛在晾衣繩上;
![]()
→將那件T恤給穿到滑板手身上。
![]()
作為AI生成圖像的重要應用,ChatGPT圖像在創造性改造現有圖片方面也有進步。例如將公司CEO奧爾特曼的個人照,轉換成美國80年代的健美操教練,或是把他的臉放進世界名畫《戴珍珠耳環的少女》中。
![]()
另外,ChatGPT也向谷歌的傳統優勢項目——生成富含文字信息的示意圖,發起了挑戰。OpenAI表示,該模型在文本呈現上更進一步,能夠處理更密集、更小的文字。
![]()
需要說明的是,雖然ChatGPT在生成英文字體時已經能夠“以假亂真”,但官方也承認,這個新模型在生成中文、阿拉伯語、希伯來語方面仍存在局限性。
![]()
因此,至少在中文文字圖像生成方面, Nano Banana依然是徹底碾壓ChatGPT的存在。
![]()
值得一提的是,新圖像生成模型更強、也更便宜了。與GPT Image 1相比,升級后的GPT Image 1.5圖像輸入和輸出成本均降低20%。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.