大家好,我是冷逸。
最近,AI圈有三大奇觀:養龍蝦,等種子,玩香蕉。
而今天,「香蕉2」正式發布了,官方名字Gemini 3.1 Flash Image。
一看這個名字,你就能明白,谷歌這是把Nano Banana的能力 + Flash的速度,直接合體了。
我們的老朋友lovart.ai,也第一時間接入了2,付費會員依舊0積分體驗。
![]()
先給大家簡單做一個總結:
1)2整體性能和Pro差距不大,部分場景甚至略有退步。
2)多文字生成,依舊容易亂碼(尤其是中文)。
3)核心是價格直接砍半。一張1k圖,Pro要0.134美元,2只要0.0672美元。
4)同時,速度大幅提升。API可以做到2秒出圖,每分鐘能夠穩定輸出347-356張圖。
5)新增4:1、1:4、8:1、1:8等超寬/超窄比例,覆蓋更多設計場景。
6)新增512px低分辨率選項,加上已有的1K、2K、4K,開發者可以按需選擇。
7)內置web圖片搜索,可以實時從網上搜索參考圖來生成圖片。
8)一致性增強,單任務可保持5個角色和14個物體的一致性。
![]()
![]()
一手實測
雖然整體性能沒有質變,但2在「玩法層面」的擴展,明顯更有意思了。
下面,給大家分享我實測下來最有價值的幾個玩法。全部基于Lovart平臺完成。
1)一鍵修改素材畫幅
比如,這是2的海報,1:1比例。
![]()
我們想把它換成16:9的比例,上線平臺換成Lovart,同時保持原圖的畫面結構、UI元素和文字不變。而且原圖是我從x上下載的,分辨率很差,只有680x680,我想把它換成2K的。
于是,上傳參考圖,輸入提示詞。
提示詞:修改畫幅尺寸為16:9,文字改為中文,2K。
![]()
初版給我們的圖,有些文字沒對。沒關系,我們點擊這張圖,選擇“文字編輯”,直接替換文字就可以了。
![]()
而且,我還注意到,他們家又上新了一些編輯功能,更實用了。
![]()
來看下最終版的圖片。
![]()
這下子清晰多了,而且文字也全部換成了中文,整體結構也與原圖保持一致。
對于設計師來說,2+Lovart的這套玩法真的非常實用。過去,我們想要調整這樣一張海報圖的尺寸,如果拿不到PSD源文件,基本無解。
即使有PSD源文件,也要忙活幾個小時。而現在,只需要幾秒鐘。
對于設計師來說,這已經不是提效,是降維打擊。
2)一鍵設計極寬幅圖片
這次,2新增了4:1、1:4、8:1、1:8等超寬/超窄比例,加上原有的1:1、16:9、9:16、4:3、3:4、3:2、2:3等比例,設計場景一下子寬了很多。
特別是8:1和1:8這個極寬幅比例,拿來干Banner圖、電商詳情頁、裝修全景圖、商場圍擋、戶外廣告和游戲側壁非常好使,能給人一種極致的沉浸感。
還是前面這個圖的風格,我們結合2的模型要點,來設計一張8:1比例的Banner圖。
提示詞:
參考這個圖{參考圖}的布局和設計風格,提煉下面的文字,設計一張8:1的Banner圖,來介紹Nano Banana 2模型的核心要點。
------
簡單總結一下Nano Banana 2:
1)整體性能與Nano Banana Pro沒多少區別,部分場景甚至還略有退步。
2)多文字情況下,依舊容易出現亂碼,尤其是中文。
3)核心是價格下降,輸出一張1k圖,Nano Banana Pro要0.134美元,Nano Banana 2只要0.0672美元,降了一半。
4)同時,速度也大幅提升。API可以做到2秒出一張圖,一分鐘能夠穩定輸出347-356張圖。
5)畫幅比新增4:1、1:4、8:1、1:8等超寬/超窄比例,覆蓋更多設計場景。
6)分辨率新增512px低分辨率選項,加上已有的1K、2K、4K,開發者可以按需選擇。
7)內置了web圖片搜索,它可以實時從網上搜索參考圖,來生成圖片。
8)單任務中,最多可以保持5個角色和14個物體的一致性。還行,但不夠精美。
![]()
于是,我又設計了一版提示詞。
提示詞:模仿清明上河圖的風格,畫一張現代的【地名】的風俗畫,8:1比例,2K。這是重慶山城
![]()
這是上海外灘。
![]()
這是杭州西湖。
![]()
這是成都春熙路。
![]()
我把這套提示詞和樣圖丟群里,很多小伙伴都覺得太了。
![]()
實際上,基于這套提示詞還可以延伸出很多玩法。比如航拍版杭州。
提示詞:模仿高清攝像機的風格,畫一張現代杭州的著名地標圖,4:1比例,4K。
![]()
by@絳燁
吉卜力版佛山順德。
提示詞:模仿高清攝像機的吉卜力風格,畫一張現代順德著名地標圖,4:1比例,4K。
![]()
by沃垠AI群友@鄧
提示詞:生成一張8:1的深圳天文臺的日落圖。
![]()
3)一鍵聯網查找參考圖
這次,2還有一個獨特功能,就是內置了Web圖片搜索。
模型不再只是靠訓練數據里的「記憶」來畫圖,它可以實時從網上搜索參考圖,然后基于這些真實圖片來生成新的圖。
這個能力,不僅能讓2降低幻覺,也能拓展使用場景。
比如,生成成都今天的天氣信息圖。
提示詞:設計一個關于今日成都天氣的信息圖,包括溫度、濕度和穿衣建議。
![]()
2會先搜今天成都的真實天氣數據,再生成準確的信息圖,而不是瞎編一個數字。
也可以讓它做一些信息圖和圖鑒。
提示詞:設計一張信息圖,介紹Nano Banana 2模型。
![]()
提示詞:設計一張圖鑒畫,介紹黃腰柳鶯。
![]()
4)一口氣批量出圖
這點,是我覺得最被低估的能力。
還記得春晚cos“天命人”的宇樹武Bot嗎?
![]()
現在,它要去闖蕩江湖了,我們在Lovart上用2模型,可以一口氣生成20張分鏡圖。
提示詞:以這張圖片的機器人為主角,參考《雪中悍刀行》的場景,以水墨黑白條漫的極繁主義風格,展示機器人闖蕩江湖的過程,生成20張動畫分鏡,如同劇中形象般生動。![]()
所有分鏡均保持了主體一致、風格統一,有完整的故事線。
![]()
又比如,我們有一張女主圖片,可以在Lovart上一口氣生成8個場景的圖片。
提示詞:生成圖中主體人物在公園、櫻花樹、圖書館、辦公室、日式餐廳、火車、飛機、巴黎街頭8個場景的圖片,統一尺寸16:9,保持服裝和外貌完全一致。女主一直穿著相同的白色襯衫和黑色裙裝,發型和面部特征也統一,并未“換臉”。

理論上,Lovart Agent支持超長上下文,可以一次性生成100張以上的圖片,依然能保持一致性。
加上Lovart又有很多視頻模型,生成后的圖片可以直接創作視頻。用它來搞漫劇、短劇,已經是內容生產線級別的能力了。
這點,跟Gemini只能一張一張圖的生成,體驗還是不同的。
![]()
整體體驗下來,我的結論是:
2依然是當前最能打的圖像模型,能力獨一檔。
在做到更快、更便宜的同時,性能并沒有降智,反而新增了一些更實用的功能。
配合Lovart獨家的畫布功能和編輯功能,可以有更多的玩法。
而且,它對提示詞幾乎不挑。一句模糊的描述,一個感覺,一個方向,它都能接住。
只要你有想法,它就能有結果。
關鍵在于:你,到底想用它做什么。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.