網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

一手實測Nano Banana 2，我總結(jié)了8大新玩法

2026-02-27 22:57:35　來源: 沃垠AI

四川舉報

分享至

大家好，我是冷逸。

最近，AI圈有三大奇觀：養(yǎng)龍蝦，等種子，玩香蕉。

而今天，「香蕉2」正式發(fā)布了，官方名字Gemini 3.1 Flash Image。

一看這個名字，你就能明白，谷歌這是把Nano Banana的能力 + Flash的速度，直接合體了。

我們的老朋友lovart.ai，也第一時間接入了2，付費會員依舊0積分體驗。

先給大家簡單做一個總結(jié)：

1）2整體性能和Pro差距不大，部分場景甚至略有退步。
2）多文字生成，依舊容易亂碼（尤其是中文）。
3）核心是價格直接砍半。一張1k圖，Pro要0.134美元，2只要0.0672美元。
4）同時，速度大幅提升。API可以做到2秒出圖，每分鐘能夠穩(wěn)定輸出347-356張圖。
5）新增4:1、1:4、8:1、1:8等超寬/超窄比例，覆蓋更多設(shè)計場景。
6）新增512px低分辨率選項，加上已有的1K、2K、4K，開發(fā)者可以按需選擇。
7）內(nèi)置web圖片搜索，可以實時從網(wǎng)上搜索參考圖來生成圖片。
8）一致性增強(qiáng)，單任務(wù)可保持5個角色和14個物體的一致性。

一手實測

雖然整體性能沒有質(zhì)變，但2在「玩法層面」的擴(kuò)展，明顯更有意思了。

下面，給大家分享我實測下來最有價值的幾個玩法。全部基于Lovart平臺完成。

1）一鍵修改素材畫幅

比如，這是2的海報，1:1比例。

我們想把它換成16:9的比例，上線平臺換成Lovart，同時保持原圖的畫面結(jié)構(gòu)、UI元素和文字不變。而且原圖是我從x上下載的，分辨率很差，只有680x680，我想把它換成2K的。

于是，上傳參考圖，輸入提示詞。

提示詞：修改畫幅尺寸為16:9，文字改為中文，2K。

初版給我們的圖，有些文字沒對。沒關(guān)系，我們點擊這張圖，選擇“文字編輯”，直接替換文字就可以了。

而且，我還注意到，他們家又上新了一些編輯功能，更實用了。

來看下最終版的圖片。

這下子清晰多了，而且文字也全部換成了中文，整體結(jié)構(gòu)也與原圖保持一致。

對于設(shè)計師來說，2+Lovart的這套玩法真的非常實用。過去，我們想要調(diào)整這樣一張海報圖的尺寸，如果拿不到PSD源文件，基本無解。

即使有PSD源文件，也要忙活幾個小時。而現(xiàn)在，只需要幾秒鐘。

對于設(shè)計師來說，這已經(jīng)不是提效，是降維打擊。

2）一鍵設(shè)計極寬幅圖片

這次，2新增了4:1、1:4、8:1、1:8等超寬/超窄比例，加上原有的1:1、16:9、9:16、4:3、3:4、3:2、2:3等比例，設(shè)計場景一下子寬了很多。

特別是8:1和1:8這個極寬幅比例，拿來干Banner圖、電商詳情頁、裝修全景圖、商場圍擋、戶外廣告和游戲側(cè)壁非常好使，能給人一種極致的沉浸感。

還是前面這個圖的風(fēng)格，我們結(jié)合2的模型要點，來設(shè)計一張8:1比例的Banner圖。

提示詞：
參考這個圖{參考圖}的布局和設(shè)計風(fēng)格，提煉下面的文字，設(shè)計一張8:1的Banner圖，來介紹Nano Banana 2模型的核心要點。
------
簡單總結(jié)一下Nano Banana 2：
1）整體性能與Nano Banana Pro沒多少區(qū)別，部分場景甚至還略有退步。
2）多文字情況下，依舊容易出現(xiàn)亂碼，尤其是中文。
3）核心是價格下降，輸出一張1k圖，Nano Banana Pro要0.134美元，Nano Banana 2只要0.0672美元，降了一半。
4）同時，速度也大幅提升。API可以做到2秒出一張圖，一分鐘能夠穩(wěn)定輸出347-356張圖。
5）畫幅比新增4:1、1:4、8:1、1:8等超寬/超窄比例，覆蓋更多設(shè)計場景。
6）分辨率新增512px低分辨率選項，加上已有的1K、2K、4K，開發(fā)者可以按需選擇。
7）內(nèi)置了web圖片搜索，它可以實時從網(wǎng)上搜索參考圖，來生成圖片。
8）單任務(wù)中，最多可以保持5個角色和14個物體的一致性。

還行，但不夠精美。

于是，我又設(shè)計了一版提示詞。

提示詞：模仿清明上河圖的風(fēng)格，畫一張現(xiàn)代的【地名】的風(fēng)俗畫，8:1比例，2K。

這是重慶山城

這是上海外灘。

這是杭州西湖。

這是成都春熙路。

我把這套提示詞和樣圖丟群里，很多小伙伴都覺得太了。

實際上，基于這套提示詞還可以延伸出很多玩法。比如航拍版杭州。

提示詞：模仿高清攝像機(jī)的風(fēng)格，畫一張現(xiàn)代杭州的著名地標(biāo)圖，4:1比例，4K。

by@絳燁

吉卜力版佛山順德。

提示詞：模仿高清攝像機(jī)的吉卜力風(fēng)格，畫一張現(xiàn)代順德著名地標(biāo)圖，4:1比例，4K。

by沃垠AI群友@鄧

提示詞：生成一張8:1的深圳天文臺的日落圖。

3）一鍵聯(lián)網(wǎng)查找參考圖

這次，2還有一個獨特功能，就是內(nèi)置了Web圖片搜索。

模型不再只是靠訓(xùn)練數(shù)據(jù)里的「記憶」來畫圖，它可以實時從網(wǎng)上搜索參考圖，然后基于這些真實圖片來生成新的圖。

這個能力，不僅能讓2降低幻覺，也能拓展使用場景。

比如，生成成都今天的天氣信息圖。

提示詞：設(shè)計一個關(guān)于今日成都天氣的信息圖，包括溫度、濕度和穿衣建議。

2會先搜今天成都的真實天氣數(shù)據(jù)，再生成準(zhǔn)確的信息圖，而不是瞎編一個數(shù)字。

也可以讓它做一些信息圖和圖鑒。

提示詞：設(shè)計一張信息圖，介紹Nano Banana 2模型。

提示詞：設(shè)計一張圖鑒畫，介紹黃腰柳鶯。

4）一口氣批量出圖

這點，是我覺得最被低估的能力。

還記得春晚cos“天命人”的宇樹武Bot嗎？

現(xiàn)在，它要去闖蕩江湖了，我們在Lovart上用2模型，可以一口氣生成20張分鏡圖。

提示詞：以這張圖片的機(jī)器人為主角，參考《雪中悍刀行》的場景，以水墨黑白條漫的極繁主義風(fēng)格，展示機(jī)器人闖蕩江湖的過程，生成20張動畫分鏡，如同劇中形象般生動。

所有分鏡均保持了主體一致、風(fēng)格統(tǒng)一，有完整的故事線。

又比如，我們有一張女主圖片，可以在Lovart上一口氣生成8個場景的圖片。

提示詞：生成圖中主體人物在公園、櫻花樹、圖書館、辦公室、日式餐廳、火車、飛機(jī)、巴黎街頭8個場景的圖片，統(tǒng)一尺寸16:9，保持服裝和外貌完全一致。

女主一直穿著相同的白色襯衫和黑色裙裝，發(fā)型和面部特征也統(tǒng)一，并未“換臉”。

理論上，Lovart Agent支持超長上下文，可以一次性生成100張以上的圖片，依然能保持一致性。

加上Lovart又有很多視頻模型，生成后的圖片可以直接創(chuàng)作視頻。用它來搞漫劇、短劇，已經(jīng)是內(nèi)容生產(chǎn)線級別的能力了。

這點，跟Gemini只能一張一張圖的生成，體驗還是不同的。

整體體驗下來，我的結(jié)論是：

2依然是當(dāng)前最能打的圖像模型，能力獨一檔。

在做到更快、更便宜的同時，性能并沒有降智，反而新增了一些更實用的功能。

配合Lovart獨家的畫布功能和編輯功能，可以有更多的玩法。

而且，它對提示詞幾乎不挑。一句模糊的描述，一個感覺，一個方向，它都能接住。

只要你有想法，它就能有結(jié)果。

關(guān)鍵在于：你，到底想用它做什么。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.