網易首頁 > 網易號 > 正文申請入駐

Agnes接入Banana：日活5萬+的多Agent工作流，中文不再出戲

2025-09-12 19:41:34　來源: AI進化論花生

北京舉報

分享至

先拋個結論：Agnes 可能是我見過最像“AI虛擬設計團隊”的產品。

它最近接入了谷歌的 Nano Banana 模型，但玩出來的效果，卻完全不是大家在小紅書或朋友圈里常見的那種“玩票式生圖”。

我這段時間沒少寫谷歌Nano Banana模型相關的內容，你大概也在很多公眾號/小紅書看過Nano Banana的各類玩法。一句話生成和名人的合作，一句話把自己變成手辦模型，修改圖片上的細節，融合多圖的元素也在電商等行業有諸多應用場景。

可真到落地，兩個老問題就會冒頭——中文元素一加就破功，圖做完還得在一堆工具之間復制粘貼。Agnes 這次把兩件事同時補齊：接入Nano Banana 的同時，用“多模型混合 + Deep Design 多 Agent 評審迭代”的系統工程，把中文生成和工作閉環都搞成了默認選項。

從核心體驗來說，Agnes 在9月1日的更新中就接入了 Banana，并做了三層增強。

第一層是智能分流：當你的畫面需要中文標題、包裝文案、路牌、UI 中文標簽等，系統會自動并行調用更擅長中文的模型參與生成，再把多個候選交給評審機制。

第二層是 Deep Design 的“找茬—改進—優選”：多個 Agent 從構圖、風格一致性、文本可讀性、與任務目標的貼合度逐項審視，不合格就把意見翻譯成下一輪的繪圖指令，直到達到閾值或者你拍板。

第三層是工作閉環：圖像不是終點，你可以一鍵把它送進視頻模塊做 9:16 或 16:9 的開場與轉場，也能把研究結果與設計稿直接裝訂成可編輯的 AI Slides；網頁和移動端的上下文與記憶層實時同步，電腦上起的活，地鐵里也能接著干。

實測Agnes多agent設計工作流

我用個實際的生成城市3D卡通圖的案例讓大家看看是怎么回事。

我提供了一個極其簡單，且有些模糊的要求：

幫我分別生成世界前5大城市的三維卡通立體圖，圖上要有對應城市的中文名

讓我們看看Agnes是如何工作的，首先它會拆解任務，規劃出它需要完成的輸出任務。在這一步，你可以選擇是否開啟「Deep Design」，再讓Agnes繼續。

強烈建議開啟！！！

雖然可能會消耗更多的圖片生成點數，但我覺得這是Agnes相比其他設計工具最大的特點之一，在「Deep Design」模式下，Agnes會啟動設計評審的機制，對生成的圖片效果進行專業審核，再判斷是否需要重新生成，以及如何優化。

接著看實際執行，它先調用Plan Schedule工具規劃了要幫我完成設計的完整步驟。包括請設計導師提供關于卡通立體圖的整體設計風格、顏色系統、字體等方面的專業指導。再讓視覺生成器將根據設計指導，分五步生成每座城市（東京、德里、上海、圣保羅、墨西哥城）的卡通立體圖，并確保圖上包含清晰的中文城市名。

設計指導涵蓋的內容包括整體設計風格、顏色系統、字體選擇、地標元素、三維表現形式、中文名標注規范等。

接下來它又調用Visual Principles工具，為我的需求規劃了非常詳盡的設計規范，包括核心風格（Core Style）、核心概念（Core Concept）、情緒氛圍（Mood/Flow）、具體的顏色規范（Color Palette）、字體系統（Typography System）、布局（Layout）、核心視覺元素（Key Visual Elements）等，非常詳盡且豐富。這完全就是給我的任務整了個設計團隊，做了全套的VI設計。

我自己來的話，別說不知道每個模塊怎么寫，甚至該寫哪些東西都是懵的。

在設計規范定義之后，Agnes再次調用Prompt Enhancing工具，為每張圖片生成了非常詳盡的提示詞。

比如，東京的生圖提示詞是這樣的：

A vibrant and imaginative 3D cartoon立體ism illustration of Tokyo. 
The image features iconic landmarks like Tokyo Tower, Senso-ji Temple, and the Shibuya Crossing, all rendered in a cute, stylized, and blocky low-poly aesthetic with rounded edges. 
The color palette is bright and cheerful, dominated by "活力藍" #66B2FF, "陽光黃" , and "草木綠" #8BC34A, with accents of "卡通紅"  and "溫暖橙" . Soft, warm lighting casts gentle, clean-edged shadows, emphasizing the volumetric forms. 
A prominent, stylized 3D Chinese character "東京" is seamlessly integrated into the scene, rendered in a bold, rounded sans-serif font with a subtle shadow for depth. 
The overall mood is活潑, 愉悅, and充滿好奇, creating a whimsical "世界都市奇趣之旅". Ratio 16:9, high resolution, 4K.

也就是說，你完全不需要自己薅盡頭發硬想提示詞，也不需要到處復制黏貼網上大神的提示詞，再讓他們躺在你的收藏夾里落灰了。

你只需要自己語言表達清楚需求，Agnes為你提供的「虛擬設計團隊」里自有專家幫你設計完整、專業的提示詞，而且這些提示詞不是為了炫技，不是為了復雜而復雜，而是真正在結合設計目標的情況下所生成的。

所以，接下來，我們再看看這一套流程下，生成的效果是怎么樣的。

先看上海和東京的兩個案例，可以看出因為有前置的設計規范的加持，兩個圖片的設計風格維持得相當一致，且中文字體的表現非常穩定出色。

但是，大家，也知道，AI總有抽卡的情況，一開始生成的德里和圣保羅這兩個城市的效果就沒那么理想了，主要是文字出現了錯亂，風格也不太準確。

但是，接下來的環節，讓我相當驚喜。

在啟動「Deep Design」的模式下，Agnes會在生圖后引入「找茬評審」的角色，對生成的圖片質量進行打分，并且，這個評審還真是毫不留情面，分別打出過55、78、57、60的分數，在經過多輪迭代之后

而且這個評分還真不是張口就好，我覺得比現在某些綜藝節目的評審強多了，分數維度拆分清晰，包括對Prompt指令的遵從性，圖片的細節豐富程度，構圖等等，有理有據

在經過多輪優化后，終于得到了兩個90分以上的結果

最好，簡要總結下，Agnes 之行的特點就是先把任務拆成角色與階段，再把每一步產物顯式化：先有設計指導，再落地視覺原則，再生成面向機器可執行的提示詞，最后進入生成—找茬—再生成—優選的閉環。你給的是目標，它給你配齊「虛擬設計團隊」。

如果你好奇這件事一定要Agent做嗎？直接使用nano banana不行嗎？我們可以看下在同等提示詞下，Nano Banana的產出效果

呃...這確實命中nano banana的能力禁區了。

而回到Agnes的話，你讓它去做你直接用Nano Banana可以完成得很好的任務，則也是毫無壓力的，比如生成任務手辦照片

比如，和名人的合影

從圖片到視頻、PPT

很多時候，AI生成的圖片并不是我們工作中需要的最終產物。

也許，我們要做個宣傳片，需要在此基礎上再做個視頻。

也許，我們在完成一次匯報，我們需要拿圖片作為PPT的素材。

在Agnes中，你可以讓這一套工作流程完成絲滑地連接起來，不需要在不同的軟件之間復制黏貼，犧牲效率，你只需要輕輕要求一句：請參考這張圖，幫我生成動態視頻。

你就能得到下面的視頻。

為什么Agnes會不一樣？

寫到這里，我覺得很多人心里可能有個疑問：Agnes到底是誰？為什么它能把大家都在玩的 Nano Banana，做成完全不同的體驗？

背后繞不開創始人 Bruce 的故事。他從中國走出去，先在新加坡萊佛士書院、再到 UC Berkeley 數學與計算機雙學位，師從圖靈獎得主，畢業后在微軟和 LinkedIn 做核心項目。26 歲起開始連續創業，還打造過千萬級下載的應用產品。現在，他是一名新加坡國立大學的博士生，研究方向正是 AI 多 Agent 協作。

也就是說Agnes今天的設計，完全不是拍腦袋想出來的，而是直接承接了他的學術研究成果。比如《ADR-Driven Development of a Multi-Agent Workspace》這篇論文，就明確提出了“多 Agent 分工協作+共享記憶層”的設計范式；而另一篇《CodeAgent》研究的 token 效率優化，已經被應用在下一代系統里。也就是說，Agnes背后的“虛擬設計團隊”，不是簡單的產品包裝，而是有方法論和實驗驗證支撐的。

團隊本身也值得一提。它是新加坡國立大學孵化出來的科研型團隊，核心成員來自 NUS、MIT、NTU、UCB 等學校。既有學術上的厚度，也有硅谷大廠的實戰經驗。你會發現，這樣的背景下，做出的產品天然會帶點“學術味”——更關注流程、架構和系統性，而不是只追一時的效果。

這也是我很好奇的地方：很多 Agent 產品說到底還是聊天機器人加點工具接口，但 Agnes 卻在嘗試做一個完整的“工作空間”，讓 AI 真正像團隊一樣運作。這種野心和出發點，本身就和別人不一樣。

用戶能拿到什么？

說回到使用者能感受到的部分。Agnes 目前的日活已經突破五萬，說明它確實找到了市場切口。對國內用戶來說，它有兩個很現實的好處：

第一，零門檻體驗 Banana。在 Agnes 里，不需要翻梯，也不需要配置復雜環境，就能直接玩 Nano Banana，生成的圖片無水印。免費用戶每月還能拿到 80 次生圖額度。對于那些原本只能在小紅書或公眾號上看別人玩 Nano Banana 的人，現在終于能自己動手試。

第二，不止是 Banana。你會發現它其實是一個完整的工作流平臺：圖片生成之后，可以一鍵銜接到視頻，再到 PPT。再加上 Research、AI Slides、Deep Research 等功能，等于把你常用的幾個 AI 工具全都收攏在一個窗口里，電腦上做的事，手機上還能接著改。對個人來說更高效，對團隊來說也更方便協作。

所以，如果說 Nano Banana 展現了模型能力的炫技時刻，那 Agnes 就是把這種炫技變成了日常能用的工作流。它背后是一群學術和工程背景都極強的人在認真打磨，這也是為什么我會對這個產品格外好奇。

很多人可能還不了解 Agnes，但我覺得，它很可能代表了一類新的方向：不是再造一個模型，而是重新發明一個“用模型的方式”。如果你也想體驗一下這個差別，不妨去試試。

他們的官網：https://agnes.life/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.