網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

谷歌AI生圖工具更新：擅長(zhǎng)“圖文并茂”，幾乎“以假亂真”

2025-11-21 08:46:52　來源: 電廠

北京舉報(bào)

分享至

記者｜董溫淑

編輯｜高宇雷

11月20日晚間，谷歌旗下圖像生成工具Nano Banana 2更新上線。Nano Banana（Gemini 2.5 Flash Image）在8月首次發(fā)布，之后迅速引起巨大反響，一度被譽(yù)為“最強(qiáng)圖像生成引擎”。

比如，此前爆火社交網(wǎng)絡(luò)平臺(tái)的“把自己做成手辦”玩法，就是由Nano Banana提供圖片生成服務(wù)。

而本次升級(jí)，谷歌似乎正努力將這個(gè)工具從娛樂工具，進(jìn)一步升級(jí)為效率與創(chuàng)作神器。

據(jù)官方簡(jiǎn)介，Nano Banana 2（Nano Banana Pro）提供了更高的圖像質(zhì)量、更一致的編輯、更強(qiáng)的3D生成，以及針對(duì)復(fù)雜任務(wù)更深入的推理能力。全網(wǎng)實(shí)測(cè)結(jié)果也支持了這種效果描述。有網(wǎng)友在實(shí)測(cè)后講道：“我已經(jīng)分不清AI和現(xiàn)實(shí)了。”

Nano Banana 2發(fā)布后，「電廠」也第一時(shí)間獲取月度會(huì)員并進(jìn)行體驗(yàn)。根據(jù)實(shí)測(cè)，模型新增的文字理解功能堪稱驚艷，這也將圖像生成模型的能力邊界拓展至PPT等圖文并茂的解釋性圖片生成。

在諸多實(shí)例中，Nano Banana 2生成單張圖片普遍消耗75積分（作為對(duì)比，Nano Banana生成圖片消耗50積分）；Nano Banana 2的生成速度略慢于初代模型，不過仍能控制在半分鐘內(nèi)。

“用一張圖片解釋人為什么會(huì)近視，繪本畫風(fēng)，圖文并茂”，「電廠」首先輸入了這一指令，結(jié)果顯示Nano Banana 2生成了如下圖片。

可以看到，模型不僅遵循了畫風(fēng)等基礎(chǔ)指令，還自主生成了近視成因的相關(guān)內(nèi)容。

在“體現(xiàn)2025年華北地區(qū)糧食產(chǎn)量，PPT風(fēng)格的匯報(bào)圖片”的指令下，Nano Banana 2生成的圖片中，分別標(biāo)注出了華北地區(qū)各大省份的地理位置、糧食產(chǎn)量模擬數(shù)據(jù)等信息。用戶只需修改數(shù)據(jù)，就能直接使用。

為了進(jìn)一步體現(xiàn)Nano Banana 2相比初代模型的性能提升，接下來，「電廠」又分別對(duì)兩代模型輸入指令，對(duì)比生成結(jié)果。

根據(jù)“用一張圖解釋三國(guó)鼎立的歷史故事，水墨畫風(fēng)”的提示詞，模型輸出分別為：

（上- Nano Banana 2生成結(jié)果；下- Nano Banana生成結(jié)果）

可以看到，在兩個(gè)生成任務(wù)中，Nano Banana 2模型生成結(jié)果以地圖形式呈現(xiàn)，基本還原了魏蜀吳三國(guó)的相對(duì)地理位置，更符合現(xiàn)實(shí)情況，且在畫作主體中并未出現(xiàn)錯(cuò)別字等問題；相較之下，初代模型對(duì)歷史故事的理解更加“扁平”，并未體現(xiàn)地理位置，并且出現(xiàn)了大量錯(cuò)別字情況。

換句話說，借助Nano Banana 2已經(jīng)具備了對(duì)PPT、繪本等解釋性圖片內(nèi)容的生成能力。

此外在生成現(xiàn)實(shí)內(nèi)容方面，Nano Banana 2也達(dá)到了“以假亂真”的效果。

在“一張街角抓拍照，一位女士邊走邊手機(jī)打視頻電話，路邊有來往行人”的提示詞下，Nano Banana 2生成的圖片除了呈現(xiàn)來往行人、視頻電話等核心要素，還自主增添了馬路、斑馬線、路邊咖啡店等要素。

值得一提的是，圖片右側(cè)所生成的咖啡店，還“細(xì)心”地保持了中英文店名的一致“咖啡啡- COFFEE”，實(shí)拍照片感十足。

面對(duì)漫畫生成等創(chuàng)作任務(wù)，Nano Banana 2同樣表現(xiàn)出合格的審美。以“四格漫畫，展現(xiàn)高樓火災(zāi)時(shí)的合理逃生方式”的提示詞為例，生成圖片幾乎可以直接打印作為消防知識(shí)普及海報(bào)使用。

談及圖像生成產(chǎn)品的“暗面”，市場(chǎng)的擔(dān)憂普遍集中在人像版權(quán)濫用、DeepFake深偽黑產(chǎn)等問題，迄今市場(chǎng)尚未探索出明確的解決方案。

本次「電廠」也用Nano Banana 2成功生成了各類“名人照片”。

（提示詞：馬斯克與黃仁勛在發(fā)布會(huì)上握手的照片）

（提示詞：男演員肖戰(zhàn)身穿宇航服的照片）

無論如何，AI圖像生成將在內(nèi)容創(chuàng)意、營(yíng)銷、設(shè)計(jì)等領(lǐng)域創(chuàng)造巨大價(jià)值已是不爭(zhēng)的事實(shí)。Business Insights.最新報(bào)告預(yù)計(jì)，到2030年，全球AI圖像引擎市場(chǎng)預(yù)計(jì)將增加至917.45萬(wàn)美元，2023年至2030年的復(fù)合年增長(zhǎng)率達(dá)17.4％。

而Nano Banana 2在用戶群體中引發(fā)的討論，也將成為谷歌在大模型市場(chǎng)多模態(tài)能力競(jìng)賽中的一大有利條件。

11月18日晚間，谷歌新一代大模型Gemini 3完成更新。市場(chǎng)普遍認(rèn)為，Gemini 3圖像多模能力大幅提升，目前尚不清楚Gemini 3是否與Nano Banana 2底層能力互通。

不過，Nano Banana官方網(wǎng)頁(yè)中寫道：“谷歌尚未正式宣布Gemini與Nano Banana的具體關(guān)系，（但）Nano Banana的性能和能力表明了，它建立在 Gemini人工智能家族的基礎(chǔ)之上。”

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.