![]()
記者|董溫淑
編輯|高宇雷
11月20日晚間,谷歌旗下圖像生成工具Nano Banana 2更新上線。Nano Banana(Gemini 2.5 Flash Image) 在8月首次發(fā)布,之后迅速引起巨大反響,一度被譽(yù)為“最強(qiáng)圖像生成引擎”。
比如,此前爆火社交網(wǎng)絡(luò)平臺的“把自己做成手辦”玩法,就是由Nano Banana提供圖片生成服務(wù)。
而本次升級,谷歌似乎正努力將這個工具從娛樂工具,進(jìn)一步升級為效率與創(chuàng)作神器。
據(jù)官方簡介,Nano Banana 2(Nano Banana Pro)提供了更高的圖像質(zhì)量、更一致的編輯、更強(qiáng)的3D生成,以及針對復(fù)雜任務(wù)更深入的推理能力。全網(wǎng)實(shí)測結(jié)果也支持了這種效果描述。有網(wǎng)友在實(shí)測后講道:“我已經(jīng)分不清AI和現(xiàn)實(shí)了。”
Nano Banana 2發(fā)布后,「電廠」也第一時間獲取月度會員并進(jìn)行體驗(yàn)。根據(jù)實(shí)測,模型新增的文字理解功能堪稱驚艷,這也將圖像生成模型的能力邊界拓展至PPT等圖文并茂的解釋性圖片生成。
在諸多實(shí)例中,Nano Banana 2生成單張圖片普遍消耗75積分(作為對比,Nano Banana生成圖片消耗50積分);Nano Banana 2的生成速度略慢于初代模型,不過仍能控制在半分鐘內(nèi)。
“用一張圖片解釋人為什么會近視,繪本畫風(fēng),圖文并茂”,「電廠」首先輸入了這一指令,結(jié)果顯示Nano Banana 2生成了如下圖片。
可以看到,模型不僅遵循了畫風(fēng)等基礎(chǔ)指令,還自主生成了近視成因的相關(guān)內(nèi)容。
![]()
在“體現(xiàn)2025年華北地區(qū)糧食產(chǎn)量,PPT風(fēng)格的匯報(bào)圖片”的指令下,Nano Banana 2生成的圖片中,分別標(biāo)注出了華北地區(qū)各大省份的地理位置、糧食產(chǎn)量模擬數(shù)據(jù)等信息。用戶只需修改數(shù)據(jù),就能直接使用。
![]()
為了進(jìn)一步體現(xiàn)Nano Banana 2相比初代模型的性能提升,接下來,「電廠」又分別對兩代模型輸入指令,對比生成結(jié)果。
根據(jù)“用一張圖解釋三國鼎立的歷史故事,水墨畫風(fēng)”的提示詞,模型輸出分別為:
![]()
![]()
(上- Nano Banana 2生成結(jié)果;下- Nano Banana生成結(jié)果)
可以看到,在兩個生成任務(wù)中,Nano Banana 2模型生成結(jié)果以地圖形式呈現(xiàn),基本還原了魏蜀吳三國的相對地理位置,更符合現(xiàn)實(shí)情況,且在畫作主體中并未出現(xiàn)錯別字等問題;相較之下,初代模型對歷史故事的理解更加“扁平”,并未體現(xiàn)地理位置,并且出現(xiàn)了大量錯別字情況。
換句話說,借助Nano Banana 2已經(jīng)具備了對PPT、繪本等解釋性圖片內(nèi)容的生成能力。
此外在生成現(xiàn)實(shí)內(nèi)容方面,Nano Banana 2也達(dá)到了“以假亂真”的效果。
在“一張街角抓拍照,一位女士邊走邊手機(jī)打視頻電話,路邊有來往行人”的提示詞下,Nano Banana 2生成的圖片除了呈現(xiàn)來往行人、視頻電話等核心要素,還自主增添了馬路、斑馬線、路邊咖啡店等要素。
![]()
值得一提的是,圖片右側(cè)所生成的咖啡店,還“細(xì)心”地保持了中英文店名的一致“咖啡啡- COFFEE”,實(shí)拍照片感十足。
面對漫畫生成等創(chuàng)作任務(wù),Nano Banana 2同樣表現(xiàn)出合格的審美。以“四格漫畫,展現(xiàn)高樓火災(zāi)時的合理逃生方式”的提示詞為例,生成圖片幾乎可以直接打印作為消防知識普及海報(bào)使用。
![]()
談及圖像生成產(chǎn)品的“暗面”,市場的擔(dān)憂普遍集中在人像版權(quán)濫用、DeepFake深偽黑產(chǎn)等問題,迄今市場尚未探索出明確的解決方案。
本次「電廠」也用Nano Banana 2成功生成了各類“名人照片”。
![]()
(提示詞:馬斯克與黃仁勛在發(fā)布會上握手的照片)
![]()
(提示詞:男演員肖戰(zhàn)身穿宇航服的照片)
無論如何,AI圖像生成將在內(nèi)容創(chuàng)意、營銷、設(shè)計(jì)等領(lǐng)域創(chuàng)造巨大價(jià)值已是不爭的事實(shí)。Business Insights.最新報(bào)告預(yù)計(jì),到2030年,全球AI圖像引擎市場預(yù)計(jì)將增加至917.45萬美元,2023年至2030年的復(fù)合年增長率達(dá)17.4%。
而Nano Banana 2在用戶群體中引發(fā)的討論,也將成為谷歌在大模型市場多模態(tài)能力競賽中的一大有利條件。
11月18日晚間,谷歌新一代大模型Gemini 3完成更新。市場普遍認(rèn)為,Gemini 3圖像多模能力大幅提升 ,目前尚不清楚Gemini 3是否與Nano Banana 2底層能力互通。
不過,Nano Banana官方網(wǎng)頁中寫道:“谷歌尚未正式宣布Gemini與Nano Banana的具體關(guān)系,(但)Nano Banana的性能和能力表明了,它建立在 Gemini人工智能家族的基礎(chǔ)之上。”
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.