![]()
作者 | 周一笑
郵箱 | zhouyixiao@pingwest.com
2月26日,Google發布了Nano Banana 2,Nano Banana圖像生成系列的第三款模型。
技術名稱為Gemini 3.1 Flash Image,它試圖解決一個此前橫亙在開發者和普通用戶面前的矛盾:想要Pro級畫質,就得忍受Pro級的價格和等待;想要快和便宜,就只能將就初代Nano Banana的能力天花板。
先簡單回顧一下這條產品線。2025年8月,初代Nano Banana(Gemini 2.5 Flash Image)以匿名身份在LMArena上亮相后迅速出圈,成為Google近年來少有的病毒傳播AI產品。三個月后的11月,Nano Banana Pro(Gemini 3 Pro Image)發布,帶來了4K分辨率、精準文字渲染和"先推理再畫圖"的架構升級,被視為圖像生成領域的新標桿。
現在又過了三個月,Nano Banana 2把Pro的核心能力裝進了Flash的殼里,并且將全面替代Pro,成為Google全線產品的默認圖像生成模型。
半年三代,這個推進節奏在Google的AI產品矩陣中也屬罕見。
![]()
Pro的能力,Flash的成本
Nano Banana 2最直觀的變化是“Pro級能力 + Flash級速度”的組合,但具體拆開來看,幾個能力點值得關注。
聯網搜索增強的世界知識。這可能是Nano Banana 2與市面上大多數圖像生成模型最本質的差異。生成過程中,模型可以調用Google Search獲取實時信息和圖片參考,再將其融入生成結果。
Google在開發者博客中展示了一個名為“Window Seat”的demo應用:給定一個地點名稱,模型會先搜索該地點的實時天氣和街景圖片,再生成一張對應的窗外風景。它不再單純依賴訓練數據進行“回憶”,轉為基于實時信息開展創作。
這個能力讓Nano Banana 2在生成信息圖、數據可視化、或涉及特定真實場景的內容時,具備了傳統擴散模型難以匹配的優勢。
聯網搜索為全球任意窗戶生成更精準的窗外景觀。
文字渲染與圖內翻譯。文字生成一直是AI圖像模型的痛點,初代Nano Banana在這方面表現尤其不穩定。Nano Banana 2繼承了Pro版本的字符級驗證機制,能逐字檢查生成文字的準確性。
![]()
更實用的是,它新增了圖內多語言翻譯功能。給定一張包含英文標識的圖片,可以直接要求模型將文字翻譯為其他語言并重新渲染,同時保持畫面一致性。Google官方demo展示了一個“Native Wildlife”路牌被翻譯為印地語的案例,文字替換后畫面的光照和質感保持了連貫。
![]()
水循環圖解生成效果
主體一致性。Nano Banana 2支持在單個工作流中維持最多5個角色的外貌一致性,以及最多14個物體的視覺保真度。這對需要連續敘事的場景來說是關鍵能力,比如故事板、品牌素材、漫畫分鏡等。
Google展示了一組案例,三個毛絨角色搭建樹屋的六格連續故事,每格的角色服裝和面部特征保持穩定,但表情和姿態有自然變化。
![]()
三個毛絨角色搭建樹屋的六格故事
分辨率與格式覆蓋。 支持512px到4K的四檔分辨率輸出。其中512px是新增的低分辨率檔位,專為需要快速迭代的批量生成場景設計。寬高比方面新增了4:1、1:4、8:1、1:8等極端比例,覆蓋了從豎版社交媒體到超寬banner的各類需求,這些是Pro版本此前不支持的。
可配置思考深度。 面向開發者的新功能:允許調節模型的推理強度,從Minimal(默認,最快)到High/Dynamic(更慢但更精準)。相當于把"畫質vs速度"的取舍權交到了開發者手中,可以根據場景靈活選擇。
![]()
發布后,獨立評測機構Artificial Analysis在X上公布了Arena排名結果,Nano Banana 2以Pro一半的價格拿下了文生圖榜單第一,圖像編輯方面排名第三,僅次于GPT Image 1.5和Nano Banana Pro。獨立開發者levelsio在獲得提前體驗后也表示,主體一致性是這次最大的突破,“照片終于真正像你訓練的那個人了,而不是有點像”。
在Google官方公布的GenAI-Bench評測結果中,NB2在開啟聯網搜索和Thinking模式后,三項指標均領先于Nano Banana Pro和GPT-Image 1.5。
![]()
把圖像生成變成基礎設施
如果只看能力升級,Nano Banana 2是一次常規的版本迭代。但Google圍繞它做的產品布局,透露出更大的意圖。
全線替換為默認。Nano Banana 2將成為Gemini App中Fast、Thinking和Pro三個模式的默認圖像生成引擎,直接替換此前的Nano Banana Pro。絕大多數Gemini用戶接觸到的圖像生成能力,都將由NB2提供。
Pro版本并未下線,但被推到了一個更小眾的位置:只有Google AI Pro和Ultra的付費用戶可以通過"三點菜單 → 重新生成"來手動調用。
產品滲透范圍。 除Gemini App外,NB2同步上線了Google Search的AI Mode和Lens(覆蓋141個新國家和地區、8種新增語言)、Flow(Google的AI創意工具,NB2成為默認且零積分使用)、Google Ads(生成廣告素材建議)、AI Studio、Gemini API、Vertex AI和Google Antigravity。
![]()
Google做了一個演示應用“全球廣告本地化器”來展示NB2的能力
幾乎覆蓋了Google AI產品矩陣中所有與圖像相關的觸點。目前NB2已開始滾動上線,普通用戶打開Gemini App即可體驗(已替換為默認模型),已在搜索(覆蓋 141 個國家)以及 Flow+中推出,開發者可通過AI Studio和Gemini API接入,Antigravity也已上線,目前為preview狀態。
定價策略。 API端的價格值得單獨說。1K分辨率下,NB2的單張生成成本約$0.067,相比Pro的$0.134幾乎砍半;4K分辨率約$0.151,較Pro節省近40%。Batch模式(異步處理,24小時內交付)在此基礎上再打對折。文本token的輸入輸出價格也較Pro低了約75%。
![]()
把這些動作放在一起看:Google的意圖不在發布一個供用戶挑選的新工具,而是在把圖像生成能力以盡可能低的摩擦嵌入其所有產品。當NB2成為Search、Ads、Flow的默認引擎時,大量用戶甚至不需要主動選擇就已經在使用它。對開發者而言,大幅下降的API成本讓大規模調用成為現實。
NB2的競爭策略不完全是在圖像模型的維度上對標競品,而是利用Google的分發優勢和生態整合能力,讓圖像生成滲透到用戶的日常工作流里。
對手在卷畫質,Google在卷覆蓋
Nano Banana 2并非在真空中發布。前段時間阿里Qwen團隊推出了Qwen-Image-2.0,一個70億參數的圖像模型,社區評價認為其質量已接近Nano Banana Pro。雖然權重尚未公開,但前代Qwen-Image系列均以Apache 2.0協議開源,社區普遍預期2.0也會跟進,屆時企業就可以在自己的基礎設施上運行,無需按張付費。
Qwen不是個例。去年11月,由Stable Diffusion原班人馬創立的Black Forest Labs發布了FLUX.2系列,其最高配置FLUX.2 [max]擁有320億參數,同樣集成了語言模型推理和聯網搜索能力,直接對標Nano Banana Pro。字節跳動也在今年2月推出了Seedream 5.0 Lite,同樣具備聯網搜索和推理生圖能力,并已嵌入剪映和CapCut,走的也是能力內嵌到現有產品的路線。
加上此前各家陸續釋出的圖像模型,這個賽道上的替代方案正在迅速豐富起來,在文字渲染、風格控制、編輯能力等不同維度上各有所長。
NB2的回應方式并不是單純的質量碾壓。來自The Decoder的早期實測顯示,在一個包含馬騎人的復雜反常識prompt測試中,NB2成功完成了任務,此前只有Pro版本能穩定做到。但評測者也指出,Pro在整體畫面的真實感和動態感上仍然優于NB2,后者在某些場景下還有一種略顯人工的質感。
![]()
上:NB2 下:NBPro
Google顯然也清楚這一點,否則沒有必要繼續為付費用戶保留Pro選項。NB2的競爭策略更準確地說是,用Flash級的成本提供“足夠好”的質量,然后靠Google的分發網絡在規模上取勝。這和開源陣營追求的在自有基礎設施上運行最好的模型形成了兩條完全不同的路徑。
在安全標記方面,所有NB2生成的圖像都將攜帶SynthID水印,并支持C2PA Content Credentials標準。Google稱自去年11月上線SynthID驗證功能以來,該功能已被使用超過2000萬次。
半年時間,Google把Nano Banana從一個病毒傳播的實驗功能推進到了覆蓋核心產品線的默認能力。當AI圖像生成的成本不斷趨近于零、質量趨近于足夠好,Google沒有選擇在模型競賽中爭奪每一個百分點的畫質優勢,而是把這個能力做成水電一樣的東西,默認開啟,隨處可用。對于Google來說,Nano Banana系列真正的產品不是圖像模型本身,而是“讓十億級用戶在不知不覺中開始使用AI圖像生成”這件事。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.