先拋個(gè)結(jié)論:Agnes 可能是我見過最像“AI虛擬設(shè)計(jì)團(tuán)隊(duì)”的產(chǎn)品。
它最近接入了谷歌的 Nano Banana 模型,但玩出來的效果,卻完全不是大家在小紅書或朋友圈里常見的那種“玩票式生圖”。
我這段時(shí)間沒少寫谷歌Nano Banana模型相關(guān)的內(nèi)容,你大概也在很多公眾號(hào)/小紅書看過Nano Banana的各類玩法。一句話生成和名人的合作,一句話把自己變成手辦模型,修改圖片上的細(xì)節(jié),融合多圖的元素也在電商等行業(yè)有諸多應(yīng)用場景。
可真到落地,兩個(gè)老問題就會(huì)冒頭——中文元素一加就破功,圖做完還得在一堆工具之間復(fù)制粘貼。Agnes 這次把兩件事同時(shí)補(bǔ)齊:接入Nano Banana 的同時(shí),用“多模型混合 + Deep Design 多 Agent 評審迭代”的系統(tǒng)工程,把中文生成和工作閉環(huán)都搞成了默認(rèn)選項(xiàng)。
從核心體驗(yàn)來說,Agnes 在9月1日的更新中就接入了 Banana,并做了三層增強(qiáng)。
第一層是智能分流:當(dāng)你的畫面需要中文標(biāo)題、包裝文案、路牌、UI 中文標(biāo)簽等,系統(tǒng)會(huì)自動(dòng)并行調(diào)用更擅長中文的模型參與生成,再把多個(gè)候選交給評審機(jī)制。
第二層是 Deep Design 的“找茬—改進(jìn)—優(yōu)選”:多個(gè) Agent 從構(gòu)圖、風(fēng)格一致性、文本可讀性、與任務(wù)目標(biāo)的貼合度逐項(xiàng)審視,不合格就把意見翻譯成下一輪的繪圖指令,直到達(dá)到閾值或者你拍板。
第三層是工作閉環(huán):圖像不是終點(diǎn),你可以一鍵把它送進(jìn)視頻模塊做 9:16 或 16:9 的開場與轉(zhuǎn)場,也能把研究結(jié)果與設(shè)計(jì)稿直接裝訂成可編輯的 AI Slides;網(wǎng)頁和移動(dòng)端的上下文與記憶層實(shí)時(shí)同步,電腦上起的活,地鐵里也能接著干。
實(shí)測Agnes多agent設(shè)計(jì)工作流
我用個(gè)實(shí)際的生成城市3D卡通圖的案例讓大家看看是怎么回事。
我提供了一個(gè)極其簡單,且有些模糊的要求:
幫我分別生成世界前5大城市的三維卡通立體圖,圖上要有對應(yīng)城市的中文名讓我們看看Agnes是如何工作的,首先它會(huì)拆解任務(wù),規(guī)劃出它需要完成的輸出任務(wù)。在這一步,你可以選擇是否開啟「Deep Design」,再讓Agnes繼續(xù)。
強(qiáng)烈建議開啟!!!
雖然可能會(huì)消耗更多的圖片生成點(diǎn)數(shù),但我覺得這是Agnes相比其他設(shè)計(jì)工具最大的特點(diǎn)之一,在「Deep Design」模式下,Agnes會(huì)啟動(dòng)設(shè)計(jì)評審的機(jī)制,對生成的圖片效果進(jìn)行專業(yè)審核,再判斷是否需要重新生成,以及如何優(yōu)化。
接著看實(shí)際執(zhí)行,它先調(diào)用Plan Schedule工具規(guī)劃了要幫我完成設(shè)計(jì)的完整步驟。包括請?jiān)O(shè)計(jì)導(dǎo)師提供關(guān)于卡通立體圖的整體設(shè)計(jì)風(fēng)格、顏色系統(tǒng)、字體等方面的專業(yè)指導(dǎo)。再讓視覺生成器將根據(jù)設(shè)計(jì)指導(dǎo),分五步生成每座城市(東京、德里、上海、圣保羅、墨西哥城)的卡通立體圖,并確保圖上包含清晰的中文城市名。
設(shè)計(jì)指導(dǎo)涵蓋的內(nèi)容包括整體設(shè)計(jì)風(fēng)格、顏色系統(tǒng)、字體選擇、地標(biāo)元素、三維表現(xiàn)形式、中文名標(biāo)注規(guī)范等。
接下來它又調(diào)用Visual Principles工具,為我的需求規(guī)劃了非常詳盡的設(shè)計(jì)規(guī)范,包括核心風(fēng)格(Core Style)、核心概念(Core Concept)、情緒氛圍(Mood/Flow)、具體的顏色規(guī)范(Color Palette)、字體系統(tǒng)(Typography System)、布局(Layout)、核心視覺元素(Key Visual Elements)等,非常詳盡且豐富。這完全就是給我的任務(wù)整了個(gè)設(shè)計(jì)團(tuán)隊(duì),做了全套的VI設(shè)計(jì)。
我自己來的話,別說不知道每個(gè)模塊怎么寫,甚至該寫哪些東西都是懵的。
在設(shè)計(jì)規(guī)范定義之后,Agnes再次調(diào)用Prompt Enhancing工具,為每張圖片生成了非常詳盡的提示詞。
比如,東京的生圖提示詞是這樣的:
A vibrant and imaginative 3D cartoon立體ism illustration of Tokyo.
The image features iconic landmarks like Tokyo Tower, Senso-ji Temple, and the Shibuya Crossing, all rendered in a cute, stylized, and blocky low-poly aesthetic with rounded edges.
The color palette is bright and cheerful, dominated by "活力藍(lán)" #66B2FF, "陽光黃" , and "草木綠" #8BC34A, with accents of "卡通紅" and "溫暖橙" . Soft, warm lighting casts gentle, clean-edged shadows, emphasizing the volumetric forms.
A prominent, stylized 3D Chinese character "東京" is seamlessly integrated into the scene, rendered in a bold, rounded sans-serif font with a subtle shadow for depth.
The overall mood is活潑, 愉悅, and充滿好奇, creating a whimsical "世界都市奇趣之旅". Ratio 16:9, high resolution, 4K.也就是說,你完全不需要自己薅盡頭發(fā)硬想提示詞,也不需要到處復(fù)制黏貼網(wǎng)上大神的提示詞,再讓他們躺在你的收藏夾里落灰了。
你只需要自己語言表達(dá)清楚需求,Agnes為你提供的「虛擬設(shè)計(jì)團(tuán)隊(duì)」里自有專家?guī)湍阍O(shè)計(jì)完整、專業(yè)的提示詞,而且這些提示詞不是為了炫技,不是為了復(fù)雜而復(fù)雜,而是真正在結(jié)合設(shè)計(jì)目標(biāo)的情況下所生成的。
所以,接下來,我們再看看這一套流程下,生成的效果是怎么樣的。
先看上海和東京的兩個(gè)案例,可以看出因?yàn)橛星爸玫脑O(shè)計(jì)規(guī)范的加持,兩個(gè)圖片的設(shè)計(jì)風(fēng)格維持得相當(dāng)一致,且中文字體的表現(xiàn)非常穩(wěn)定出色。
但是,大家,也知道,AI總有抽卡的情況,一開始生成的德里和圣保羅這兩個(gè)城市的效果就沒那么理想了,主要是文字出現(xiàn)了錯(cuò)亂,風(fēng)格也不太準(zhǔn)確。
但是,接下來的環(huán)節(jié),讓我相當(dāng)驚喜。
在啟動(dòng)「Deep Design」的模式下,Agnes會(huì)在生圖后引入「找茬評審」的角色,對生成的圖片質(zhì)量進(jìn)行打分,并且,這個(gè)評審還真是毫不留情面,分別打出過55、78、57、60的分?jǐn)?shù),在經(jīng)過多輪迭代之后
而且這個(gè)評分還真不是張口就好,我覺得比現(xiàn)在某些綜藝節(jié)目的評審強(qiáng)多了,分?jǐn)?shù)維度拆分清晰,包括對Prompt指令的遵從性,圖片的細(xì)節(jié)豐富程度,構(gòu)圖等等,有理有據(jù)
在經(jīng)過多輪優(yōu)化后,終于得到了兩個(gè)90分以上的結(jié)果
最好,簡要總結(jié)下,Agnes 之行的特點(diǎn)就是先把任務(wù)拆成角色與階段,再把每一步產(chǎn)物顯式化:先有設(shè)計(jì)指導(dǎo),再落地視覺原則,再生成面向機(jī)器可執(zhí)行的提示詞,最后進(jìn)入生成—找茬—再生成—優(yōu)選的閉環(huán)。你給的是目標(biāo),它給你配齊「虛擬設(shè)計(jì)團(tuán)隊(duì)」。
如果你好奇這件事一定要Agent做嗎?直接使用nano banana不行嗎?我們可以看下在同等提示詞下,Nano Banana的產(chǎn)出效果
呃...這確實(shí)命中nano banana的能力禁區(qū)了。
而回到Agnes的話,你讓它去做你直接用Nano Banana可以完成得很好的任務(wù),則也是毫無壓力的,比如生成任務(wù)手辦照片
比如,和名人的合影
從圖片到視頻、PPT
很多時(shí)候,AI生成的圖片并不是我們工作中需要的最終產(chǎn)物。
也許,我們要做個(gè)宣傳片,需要在此基礎(chǔ)上再做個(gè)視頻。
也許,我們在完成一次匯報(bào),我們需要拿圖片作為PPT的素材。
在Agnes中,你可以讓這一套工作流程完成絲滑地連接起來,不需要在不同的軟件之間復(fù)制黏貼,犧牲效率,你只需要輕輕要求一句:請參考這張圖,幫我生成動(dòng)態(tài)視頻。
你就能得到下面的視頻。
為什么Agnes會(huì)不一樣?
寫到這里,我覺得很多人心里可能有個(gè)疑問:Agnes到底是誰?為什么它能把大家都在玩的 Nano Banana,做成完全不同的體驗(yàn)?
背后繞不開創(chuàng)始人 Bruce 的故事。他從中國走出去,先在新加坡萊佛士書院、再到 UC Berkeley 數(shù)學(xué)與計(jì)算機(jī)雙學(xué)位,師從圖靈獎(jiǎng)得主,畢業(yè)后在微軟和 LinkedIn 做核心項(xiàng)目。26 歲起開始連續(xù)創(chuàng)業(yè),還打造過千萬級下載的應(yīng)用產(chǎn)品。現(xiàn)在,他是一名新加坡國立大學(xué)的博士生,研究方向正是 AI 多 Agent 協(xié)作。
也就是說Agnes今天的設(shè)計(jì),完全不是拍腦袋想出來的,而是直接承接了他的學(xué)術(shù)研究成果。比如《ADR-Driven Development of a Multi-Agent Workspace》這篇論文,就明確提出了“多 Agent 分工協(xié)作+共享記憶層”的設(shè)計(jì)范式;而另一篇《CodeAgent》研究的 token 效率優(yōu)化,已經(jīng)被應(yīng)用在下一代系統(tǒng)里。也就是說,Agnes背后的“虛擬設(shè)計(jì)團(tuán)隊(duì)”,不是簡單的產(chǎn)品包裝,而是有方法論和實(shí)驗(yàn)驗(yàn)證支撐的。
團(tuán)隊(duì)本身也值得一提。它是新加坡國立大學(xué)孵化出來的科研型團(tuán)隊(duì),核心成員來自 NUS、MIT、NTU、UCB 等學(xué)校。既有學(xué)術(shù)上的厚度,也有硅谷大廠的實(shí)戰(zhàn)經(jīng)驗(yàn)。你會(huì)發(fā)現(xiàn),這樣的背景下,做出的產(chǎn)品天然會(huì)帶點(diǎn)“學(xué)術(shù)味”——更關(guān)注流程、架構(gòu)和系統(tǒng)性,而不是只追一時(shí)的效果。
這也是我很好奇的地方:很多 Agent 產(chǎn)品說到底還是聊天機(jī)器人加點(diǎn)工具接口,但 Agnes 卻在嘗試做一個(gè)完整的“工作空間”,讓 AI 真正像團(tuán)隊(duì)一樣運(yùn)作。這種野心和出發(fā)點(diǎn),本身就和別人不一樣。
用戶能拿到什么?
說回到使用者能感受到的部分。Agnes 目前的日活已經(jīng)突破五萬,說明它確實(shí)找到了市場切口。對國內(nèi)用戶來說,它有兩個(gè)很現(xiàn)實(shí)的好處:
第一,零門檻體驗(yàn) Banana。在 Agnes 里,不需要翻梯,也不需要配置復(fù)雜環(huán)境,就能直接玩 Nano Banana,生成的圖片無水印。免費(fèi)用戶每月還能拿到 80 次生圖額度。對于那些原本只能在 小紅書 或 公眾號(hào) 上看別人玩 Nano Banana 的人,現(xiàn)在終于能自己動(dòng)手試。
第二,不止是 Banana。你會(huì)發(fā)現(xiàn)它其實(shí)是一個(gè)完整的工作流平臺(tái):圖片生成之后,可以一鍵銜接到視頻,再到 PPT。再加上 Research、AI Slides、Deep Research 等功能,等于把你常用的幾個(gè) AI 工具全都收攏在一個(gè)窗口里,電腦上做的事,手機(jī)上還能接著改。對個(gè)人來說更高效,對團(tuán)隊(duì)來說也更方便協(xié)作。
所以,如果說 Nano Banana 展現(xiàn)了模型能力的炫技時(shí)刻,那 Agnes 就是把這種炫技變成了日常能用的工作流。它背后是一群學(xué)術(shù)和工程背景都極強(qiáng)的人在認(rèn)真打磨,這也是為什么我會(huì)對這個(gè)產(chǎn)品格外好奇。
很多人可能還不了解 Agnes,但我覺得,它很可能代表了一類新的方向:不是再造一個(gè)模型,而是重新發(fā)明一個(gè)“用模型的方式”。如果你也想體驗(yàn)一下這個(gè)差別,不妨去試試。
他們的官網(wǎng):https://agnes.life/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.