網易首頁 > 網易號 > 正文申請入駐

Nano Banana終于不是文盲了，但我可能會變「傻」

2025-11-24 14:33:39　來源: 愛范兒

廣東舉報

分享至

過去一個周末 Gemini 3 Pro Image 的能力被反復「折磨」，花樣越來越多——噢，你問這是什么，它的另一個名字是 Nano Banana 2。這么跟個惡搞一樣的名字，居然被保留下來了。

Nano Banana2 各方面能力超群，甚至是「友商」Sam Altman 也要點頭的程度。

▲ 圖片來自：The Information

夸夸只是夸夸，Nano Banana 第二階段，其實標志著 AI 圖像生成領域的一個重要轉折點：從基于概率的「以此類推」，轉向了基于理解的「邏輯構建」。更承載著一個特殊的意義：AI 不再只是沖著你的眼睛去，還沖著你的智商去。

大語言模型不再「文盲」

一直以來 AI 生圖都有個繞不過去的問題：才華橫溢，信手拈來，但有時候就跟喝高了一樣控制不住，這從 Midjourney 時期就開始了，往后走逐漸好轉，不過始終存在。

其中最大的 bug 之一就是文字。這導致在很長一段時間里，鑒別一張圖是否由 AI 生成，最簡單的辦法就是看圖里的字。

這是基于擴散模型（Diffusion Model）的先天缺陷：它將文字視為一種紋理，而非符號。

Nano Banana 2 最直觀的突破，就在于它「識字」了。即所謂的 Text Rendering 文字渲染。

我的隨手測試「生成一張復古電影海報，標題是《香蕉的復仇》，副標題用紅色襯線體寫 2025 年上映。」

如果是在以前嘗試這個指令，大概率會得到一張極具藝術感的圖「BANANA REVENGE」的某種變體尚且能保持清晰和正常，但小字往往經不住看了，甚至有時候主標題都會拼寫成「BANNANA」。但在 Nano Banana 2 里，這些字符被準確、清晰、且符合排版美學地「寫」在了畫面上。

So what？這僅僅是省去加字的時間嗎？

對普通用戶來說可能是，而且還是一種「表情包自由」。你終于可以生成一張精準吐槽老板的圖，配上精準的文案，不用再單獨拉一個文本框。

而對于商業世界，這意味著 AI 圖像生成從「素材（Material）」階段，正式跨入了「成品」（Deliverable）階段。

▲ 圖片來自 X 用戶@chumsdock

當 AI 能夠準確地處理符號信息，它能交付的成果就更多樣也更實用，包括但不限于電商海報、PPT 配圖、甚至是數據圖表。以前設計師用 AI 只能生成背景底圖，關鍵信息還得自己貼?，F在，AI 可以直接生成原型圖，乃至帶有數據標注的餅狀圖，或者一張文字完美貼合透視關系的廣告。

這是商業交付的「最后一公里」，也是生圖模型在信息傳遞層面的巨大進步。

從「猜概率」到「懂物理」

字渲染的成功是 Nano Banana 2 底層技術躍遷的一個極具代表性的縮影，更深層的變化在于：這只「香蕉」，長了腦子。

也就是我們所說的基于「推理」的圖像生成。

大模型本質上是一個概率統計機器。當你要求畫一只「坐在玻璃桌上的貓」時，模型通過學習數億張圖片，在生成時，它只是重現像素的統計規律。

Nano Banana 2 的不同之處在于，它引入了 Gemini 3 語言模型的推理能力。在生成圖像之前，它似乎先在「大腦」里構建了一個物理模型。它知道「貓」下面通常會有模糊的影子，以及玻璃板上、下的物品有不同的光線關系。

在我的另一個隨手測試中，當要求它生成「一個復雜的化學實驗室，桌子上放著裝有藍色液體的燒杯，背景是黑板上的分子式」時，它表現出了驚人的邏輯性：

燒杯里的液體會有正確的彎液面；玻璃器皿對光線的折射符合物理直覺；最重要的是，背景黑板上的分子式不再是亂畫的線條，而是看上去像模像樣化學結構的式子（雖然還是有瑕疵）。

當畫筆有了「大腦」，交互方式變了

之所以如此強調文字生成這個本領，是因為 Text Rendering 是外在表現，反映的是 Reasoning 作為內在引擎。合在一起， Nano Banana 2 帶給用戶的最終體驗，就是一塊「會思考的畫布」（The Thinking Canvas）。

Google 將這個模型深度整合進了它的生態系統，不僅僅是生成圖片，更是「修改」現實，下一步，就是走進更嚴肅的領域：信息圖、教案、講解素材，等等等等。

整體上，圖像生成往往用戶給 20% 的指令，剩下 80% 靠 AI 腦補——以前是靠概率腦補（隨機填色）。現在則是靠因果腦補，不僅畫出了「結果」，還隱含了「過程」，這能夠讓畫面的敘事性和感染力指數級上升。

它不再只是為了取悅你的眼睛，它開始試圖取悅你的智商。像上面這種結構圖，雖然吧不敢說 100% 符合機械工程標準，但釘是釘，鉚是鉚?！高壿嬌系恼_」，是它推理能力的直接體現。

然而任何事情都是一體兩面的，當換一個角度看，這就可能意味著創造力的同質化。

當 AI 能夠完美地生成「符合商業標準」的圖表、海報和插畫時，它實際上是在拉平審美的平均線。所有的海報都排版正確、光影完美，但可能也因此失去了曾經設計中那些因為「不完美」而誕生的神來之筆。

▲ 圖片來自X用戶@dotey

更深層的問題在于真相的消逝。當上面所說的那種邏輯正確、信息「干貨」多的內容，可以被批量生產，取悅智商從未如此容易，也從未如此輕飄飄。如果它決定了我從圖片信息到文字信息的所有攝入，那……會是怎樣的景象？

還有 Deepfake 這個老大難問題，已經是老生常談了。雖然這次 Google 加上了 SynthID（一種人眼不可見的數字水印）來標記 AI 內容，但在視覺沖擊力面前，技術的防偽標簽往往是蒼白的。制造「真實」變得如此廉價和便捷，我們對「眼見為實」的信仰將被徹底重構。

至于它叫「Nano Banana」還是「Gemini 3 Pro」，其實已經不重要了。重要的是，從這一刻起，我們在屏幕上看到的每一個像素，每一行文字，都可能不再來自人類的手指，而是來自機器的思考。

這既令人興奮，又讓人在某些時刻，感到脊背發涼。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

又一國產模型黑馬出世，追平Gemini 2.5 Pro，空間編輯反超視頻模型？

智東西 2026-04-10 20:36:22
0 跟貼 0
兒童手表新國標來了，但小天才、華為們仍在「各自為戰」

雷科技 2026-04-09 10:36:50
39 跟貼 39

小米攝像頭賣200，他們賣超兩千，憑什么？

虎嗅APP 2026-04-09 01:06:05
0 跟貼 0

INAIR完成千萬美元融資，便攜空間主機適配多款 AR 眼鏡｜最前線

36氪 2026-04-09 12:03:19
0 跟貼 0
當和文盲來到KTV

提子嘮生活 2026-04-07 00:09:16
0 跟貼 0

聽老兵說，當年黃埔軍招生要求有多高，看當時90%的文盲率就懂了

歡樂笑料鋪 2026-04-10 14:36:01
1 跟貼 1

伊高官:若美約束不好以色列這條瘋狗伊朗將幫它一把

中國新聞周刊 2026-04-10 18:41:40
43167 跟貼 43167
MIT新方法讓兩顆芯片共享唯一“指紋”，重寫硬件安全規則

DeepTech深科技 2026-02-25 17:32:10
14 跟貼 14

誰在決定AI手機的未來：模型、系統，還是生態？

DeepTech深科技 2026-01-13 16:16:47
0 跟貼 0
以為只是在畫布上，隨便畫的幾筆，鏡頭拉遠驚呆了！

阿帕生活醬 2026-04-10 16:14:56
0 跟貼 0
Edge AI Daily 早報（4月11日）

鈦媒體APP 2026-04-11 08:55:06
0 跟貼 0
【楚圖南】掃盲主任委員：農民識字一千五，工人識字兩千，算脫盲

年之父 2026-04-11 02:05:03
0 跟貼 0
日本“降級”中日關系中方表態

參考消息 2026-04-10 14:22:31
113 跟貼 113
仍有地方弄虛作假！督察組進駐后，發現了不少問題

政知新媒體 2026-04-11 06:19:51
158 跟貼 158
總感覺腳丫不對勁，數了數量又對，女子發現自家寶寶獨一無二的標記

遼寧老年報全搜索 2026-04-10 01:49:00
21 跟貼 21
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
3913 跟貼 3913
那個“愛馬仕”，想拯救“智障”小龍蝦

36氪 2026-04-11 11:49:04
0 跟貼 0
組裝川崎忍者模型套件

制造科技 2026-04-09 19:07:20
20 跟貼 20
取代龍蝦的是愛馬仕？狂攬4萬星的Hermes Agent，不只是OpenClaw平替

AppSo 2026-04-10 17:26:30
4 跟貼 4
城市更新顛覆購房邏輯，財富縮水風險

紀超講樓市 2026-04-08 06:16:42
0 跟貼 0
谷歌做了個論文專用版nano banana！頂會級Figure直出

機器之心Pro 2026-02-05 15:52:42
1 跟貼 1
16家上榜！常州首批米其林餐廳揭曉

現代快報 2026-04-09 20:19:03
260 跟貼 260
論文 Figure 這樣排版，審稿人一眼就能鎖定創新點（附贈 5 套模版）

生物學霸 2025-11-11 17:23:39
0 跟貼 0
美載人繞月飛船濺落在預定海域

新華社 2026-04-11 08:11:58
541 跟貼 541
16歲癱瘓女孩誤購演唱會票引發質疑，記者實測購票過程“絲滑”無需實名認證

上觀新聞 2026-04-10 18:29:06
216 跟貼 216
大疆Pocket 4來了：時隔兩年半，「一寸萬象」能否再造爆款？

雷科技 2026-04-11 10:55:03
1 跟貼 1
標120W的充電器實際功率僅22.5W，商家：120W是產品型號

極目新聞 2026-04-11 00:53:31
5 跟貼 5
刷了三天Aippy，感覺TikTok的新對手，出現了

AI異類 2026-04-09 20:01:33
0 跟貼 0
兔子牙齒像剪刀一樣鋒利，女生拿它來咬標簽，

米高沒搞笑 2026-04-09 10:25:54
2 跟貼 2
張雪拍賣會，45秒結束

澎湃新聞 2026-04-10 23:03:03
242 跟貼 242
33城公積金繳存余額6.18萬億

每日經濟新聞 2026-04-10 21:59:48
495 跟貼 495
“彎得下腰拾荒，也抬得起手畫畫”，瀘州一奶奶車窗畫畫驚艷網友，知情人：她很樂觀

瀟湘晨報 2026-04-10 15:20:16
0 跟貼 0
中國式“雙碳”路徑，有了現場坐標系

36氪 2026-01-16 18:39:25
0 跟貼 0
SBTI離譜標簽句句都在報身份證

青年鮑里斯 2026-04-11 06:49:02
0 跟貼 0
因身體缺陷為讓妻子死心故意演戲出軌女店員

瘋兔看劇 2026-04-07 07:10:18
1 跟貼 1
不銹鋼盆上的標簽摳不掉可咋辦？這種方法可行不？

河南都市頻道 2026-04-10 14:52:26
0 跟貼 0
男子因好奇把頭伸進恐龍模型嘴里

齊魯新財經 2026-04-09 15:52:18
0 跟貼 0
古老星系的發現，讓科學家重新思考大爆炸模型

六六冷知識 2026-04-09 10:11:58
1 跟貼 1
俄總統代表正在訪美就恢復雙方經濟合作保持接觸

界面新聞 2026-04-10 18:46:50
831 跟貼 831
武術·漢服·戲曲演繹多彩菏澤——“花漾菏澤”城市大型文藝盛典側記

菏澤日報 2026-04-11 09:30:22
8 跟貼 8

湖南祁東沿路插了百余米的白事支架燈籠，上面印“奠” 下面掛長條幅，當地民政局：已全部拆除

愛范兒

消費科技第一媒體

38686文章數 2601449關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

游戲

健康

教育

家居

手機 / 數碼

房產 / 家居

Nano Banana終于不是文盲了，但我可能會變「傻」

壹號本ONEXStation迷你AI工作站上架：128GB + 1TB，18999元

牛彈琴：伊朗很悲壯 向美國提高了"要價"

牛彈琴：伊朗很悲壯 向美國提高了"要價"

換帥之后，他們從降級區沖到升級區

浪姐7淘汰 該走的沒走，不該走的走了

從日本翻身看：這次誰能扛住高油價？

半夜被燃燒瓶砸醒，OpenAI CEO發文反思

煥新極氪007/007GT上市 限時19.39萬起

態度原創

童趣與春的浪漫共舞，兩只小精靈在花瓣堆里奔跑

《幻想生活i》銷量突破150萬套之后開始進軍手游平臺

干細胞抗衰4大誤區,90%的人都中招

今年考研調劑：A區有哪些大學的名額多？B區有哪些高校的指標多？

復古風格 自然簡約

Nano Banana終于不是文盲了，但我可能會變「傻」

牛彈琴：伊朗很悲壯向美國提高了"要價"

牛彈琴：伊朗很悲壯向美國提高了"要價"

換帥之后，他們從降級區沖到升級區

浪姐7淘汰該走的沒走，不該走的走了

半夜被燃燒瓶砸醒，OpenAI CEO發文反思

煥新極氪007/007GT上市限時19.39萬起

今年考研調劑：A區有哪些大學的名額多？B區有哪些高校的指標多？

復古風格自然簡約