![]()
![]()
從“最強大腦”到“智能協(xié)作體”。
作者|王藝
編輯|王博
“單模型性能的邊際提升,正在快速遞減。”
近期我們和一些大模型(LLM)研發(fā)者溝通時,不少人都有類似的感受。
過去幾年,AI模型性能的提升主要來自兩個方向:模型參數(shù)規(guī)模擴大,訓練數(shù)據(jù)與算力的增長。
根據(jù)OpenAI、Anthropic、DeepMind等團隊的研究,模型性能與參數(shù)規(guī)模之間呈冪律關(guān)系(Power Law),即性能隨參數(shù)增加而提升,但提升幅度逐漸減小,表現(xiàn)出邊際收益遞減的趨勢。
這也和我們的觀察所吻合,今年以來,我們看到的模型改進主要來自“上下文記憶增強”“多模態(tài)融合”“推理鏈優(yōu)化”等方向,這些都不是純粹靠“變大”實現(xiàn)的,而是靠“變巧”。單一模型的“性能天花板”已悄然出現(xiàn)。
在海外,OpenAI、Anthropic、Google等大模型公司的最新模型,在性能上的差距越來越小。用戶大體的感知是:GPT系列在創(chuàng)造性和邏輯推理方面略勝,Claude系列在編碼和文本理解方面略優(yōu),Gemini系列在多模態(tài)方面略強。但對C端用戶來說,這種差異不再能直接轉(zhuǎn)化為新的付費理由。
「甲子光年」發(fā)現(xiàn),市場的競爭焦點從“模型誰更聰明”轉(zhuǎn)向“誰能更好地用這些模型”,從“模型競爭”過渡到“系統(tǒng)競爭”。AI大模型參數(shù)規(guī)模不再是關(guān)鍵,AI系統(tǒng)工程架構(gòu)的創(chuàng)新才是新的突破點。
在這種背景下,AI Agent(智能體)的成為了AI行業(yè)新的敘事主體。甲子光年智庫在《中國AI Agent行業(yè)研究報告》中,將AI Agent定義為具有自主性、反應性、交互性等特征的智能“代理” ,用公式表示就是:大模型時代的AI Agent=LLM x(規(guī)劃+記憶+工具+行動)。
而在眾多AI Agent公司之中,一家?guī)缀鯖]有投放廣告、僅24人規(guī)模的公司卻被頻頻提起——Genspark。
很多人對Genspark的印象還停留在華人硅谷創(chuàng)業(yè)公司、不斷更新的產(chǎn)品功能以及45天3600萬美元ARR(年度經(jīng)常性收入)的商業(yè)成績,但更有價值的是,這家從AI搜索起家的公司,用一套Mixture-of-Agents(多智能體混合,簡稱MoA)架構(gòu),把多模型融合成一個完整系統(tǒng)。
Genspark代表了從“做出更聰明的模型”到“讓模型們協(xié)作”的范式轉(zhuǎn)變,這也是一個關(guān)于工程哲學的故事。
1.在AI Agent領(lǐng)域率先引入MoA的概念
Genspark是由小度前CEO景鯤(Eric Jing)與小度前CTO朱凱華(Kay Zhu)聯(lián)合創(chuàng)立的MainFunc公司推出的AI Agent產(chǎn)品,2024年6月Beta版上線,初期定位為AI搜索引擎,通過生成無偏見的Sparkpages頁面提供可信信息,主要面向美國市場。
景鯤前下屬、AI從業(yè)者劉佳(化名)告訴「甲子光年」,景鯤還在小度工作的時候,就多次提到要“重構(gòu)搜索背后的內(nèi)容生態(tài)”。
后來,Genspark陸續(xù)加入Multi-Agent、Deep Research等功能,并于2025年4月升級為Super Agent產(chǎn)品,上線9天實現(xiàn)了1000萬美元的ARR,上線45天就實現(xiàn)了3600萬美元的ARR。對比來看,AI Coding領(lǐng)域的明星企業(yè)Cursor,實現(xiàn)1000萬美元ARR,用了21個月。
在眾多AI Agent產(chǎn)品中,Genspark去年底引入了MoA的概念并將其工程化。可以說,Genspark是全球最早將MoA這一概念落地到消費級AI Agent產(chǎn)品中的團隊之一。而Genspark在2024年12月的宣傳視頻中則稱其為“world's first Mixture-of-Agents (MoA) system(世界首個MoA系統(tǒng))”
簡單來說,MoA系統(tǒng)會讓多個專長不同的模型組成一個多腦協(xié)作體:比如,OpenAI模型負責創(chuàng)造性與自然語言任務,Claude負責邏輯推理與結(jié)構(gòu)化生成,Gemini負責視覺與多模態(tài)感知。當然,實際工作中MoA的機制會更復雜。
![]()
圖片來源:Genspark
不過,MoA并非Genspark首創(chuàng)。
2024年6月,Junlin Wang等作者在《Mixture-of-Agents Enhances Large Language Model Capabilities》論文中指出,隨著LLMs數(shù)量的不斷增加,如何利用多種LLMs的集體專長成為一個令人興奮的開放方向,他們寫道:“為此,我們提出了一種新方法,通過Mixture-of-Agents(MoA)利用多種LLMs的集體優(yōu)勢。在我們的方法中,我們構(gòu)建了一個分層的MoA架構(gòu),每一層由多個LLM agent組成。每個agent在生成其響應時都會將上一層所有agent的輸出作為輔助信息。MoA模型在AlpacaEval 2.0、MT-Bench和FLASK上取得了最先進的性能,超越了GPT-4 Omni。”
![]()
MoA架構(gòu),圖片來源:《Mixture-of-Agents Enhances Large Language Model Capabilities》
這篇論文的作者都來自Together AI,這是一家以研究為驅(qū)動的AI公司,賦能開發(fā)者和研究人員訓練、微調(diào)并部署生成式AI模型。
2025年1月,Genspark在其官方博客中發(fā)布了一篇文章《Enhancements in Mixture of Agents(多智能體混合的改進)》,文中提到:Mixture of Agents方法代表了AI領(lǐng)域的重大進展,特別是在提升LLMs能力方面。通過利用多個模型的力量,MoA不僅提高了性能,還為AI應用的創(chuàng)新開辟了新途徑。
Genspark還指出,MoA架構(gòu)并不限于兩層結(jié)構(gòu);它可以擴展為三層甚至更多層,從而實現(xiàn)模型之間更復雜的交互。這種多層化的設(shè)計可以通過跨多輪的響應綜合進一步優(yōu)化輸出質(zhì)量,提升最終結(jié)果的整體水平。舉例來說,在一個三層架構(gòu)中,第一層生成的初始響應會被第二層進一步加工處理,隨后在最終層進行聚合,從而得到一個更細膩、更全面的輸出結(jié)果。
值得注意的是,Genspark在這篇博客中引用了Together AI的MoA論文。
![]()
《Enhancements in Mixture of Agents》,圖片來源:Genspark
今年4月,Genspark發(fā)布Super Agent,全面轉(zhuǎn)型通用Agent,不再局限于AI搜索。
朱凱華在Genspark Super Agent上線后發(fā)布的公開信中表示:“我們做出了一個違反直覺的決定。盡管我們旗下AI搜索產(chǎn)品已覆蓋超過500萬用戶,但我們還是要將其放棄。至于理由,是因為我們認為傳統(tǒng)AI搜索已經(jīng)過時。”
![]()
《Why I Killed Our AI Search Product With 5 Million Users》,圖片來源:Genspark
Genspark Super Agent的確也取得了不錯的測評成績。在今年4月的GAIA基準測試中,Genspark就超過了Manus和OpenAI Deep Research。
![]()
圖片來源:Genspark
景鯤將這一成績歸功于“大模型、工具集、數(shù)據(jù)集”三者的協(xié)同作用,“它們讓Genspark Super Agent快速、可靠、超級可控。”
![]()
圖片來源:Genspark
轉(zhuǎn)型后的Genspark,依然堅持了MoA架構(gòu)。
Genspark Super Agent利用由9個不同規(guī)模的大模型組成了MoA系統(tǒng),該系統(tǒng)允許Agent針對特定任務動態(tài)選擇最合適的模型,從而在各種場景中確保最佳性能。與依賴單一模型的傳統(tǒng)AI系統(tǒng)不同,這種架構(gòu)增強了靈活性和效率,讓Genspark Super Agent成為用戶的多功能工具。
除此之外,我們還了解到,Genspark Super Agent可以調(diào)用圖像生成模型、視頻生成模型、音頻生成模型以及專用功能模型(翻譯、搜索、代碼、分析等),其背后的模型有將近50種,而且會動態(tài)更新。
「甲子光年」認為,隨著新一代基礎(chǔ)模型陸續(xù)登場,通用Agent的競爭格局也在重排。誰能最快吸納新模型能力、誰能最平衡模型與體驗,決定了下一個拐點。
2.Less Control, More Tools
要讓多個模型協(xié)作,不僅是模型問題,而是工程問題。
Genspark的核心突破是打造了一套稱為Agent Engine的中樞系統(tǒng)。它由兩個關(guān)鍵機制組成:模型編排(Model Orchestration)與改進循環(huán)(Improvement Loop)。
MainFunc公司CTO朱凱華用一句話概括了Genspark團隊的核心理念:“少控制,多工具(Less Control, More Tools)。”意思是不追求中心化智能,而讓系統(tǒng)自己找到最優(yōu)解。
![]()
圖片來源:朱凱華《Less Control, More Tools: How Genspark Built a Super Agent That Scales》演講
AI Agent的本質(zhì)是在一個循環(huán)中,基于環(huán)境反饋來選擇合適的工具,最終完成其任務的智能體。其核心架構(gòu)包含大腦(Brain)、規(guī)劃(Planning)、記憶(Memory)、工具使用(Tool Use)四個關(guān)鍵組件,主流的Agent框架有ReAct(Reason-Act)、Plan-Execute、Multi-Agent等。
隨著市場競爭的激烈,越來越多的AI Agent產(chǎn)品都在采用多智能體(Multi-Agent)架構(gòu)。比如,Manus采用了規(guī)劃-執(zhí)行-驗證三級代理架構(gòu),Skywork采用了五大專家Agent協(xié)同,F(xiàn)ellou推出了智能體網(wǎng)絡,Comet推出了基于瀏覽器會話的Agent集群等。相關(guān)產(chǎn)品也給用戶帶來了不錯的使用體驗。
![]()
多智能體實現(xiàn)模擬人類工作流程,圖片來源:甲子光年智庫《2024年AI Agent行業(yè)報告》
不過,我們了解到,市面上有一些聲稱自己采用了Multi-Agent架構(gòu)的Agent產(chǎn)品,實際上卻只是單一模型的角色扮演:角色A負責規(guī)劃、角色B負責執(zhí)行、角色C負責驗證。即使AutoGen、LangGraph等框架支持多Agent,但是底層依然依賴單一大模型。
如果傳統(tǒng)智能體的架構(gòu)是“單一LLM→角色A(規(guī)劃)→角色B(執(zhí)行)→角色C(驗證)”,本質(zhì)是“一個大腦控制多個手”;那么Genspark MoA的架構(gòu)則是“任務輸入 → 模型A(專業(yè)分析) → 模型B(創(chuàng)意思考) → 模型C(邏輯驗證) → 智能融合 → 最優(yōu)輸出”,本質(zhì)是“多個大腦的協(xié)同思考”。
這種“多個大腦協(xié)同思考”的MoA架構(gòu)比起單一模型加持的Multi-Agent架構(gòu)產(chǎn)品性能顯著提升。
MoA系統(tǒng)其實不僅是Genspark一家公司的優(yōu)勢,而是整個通用Agent行業(yè)的優(yōu)勢。曾經(jīng)是OpenAI第五號員工,現(xiàn)在是Convergence AI工程負責人的鄭淺,今年3月在錦秋基金組織的分享活動上就明確表示:“Agent公司的創(chuàng)業(yè)核心競爭力在于其Agent orchestrator(編排)。”
鄭淺認為,Agent核心是“大腦”即Agent orchestrator。若單純縫合工具而不加強Agent orchestrator開發(fā),就像沒有大腦只有工具的人,無法很好執(zhí)行任何任務。若Agent orchestrator能同時生成多個Agent,每個負責一篇報告并行處理,最后整合信息,效率將是線性處理的10倍。因此,并行Agent必然是未來趨勢。
如果說MoA系統(tǒng)是Genspark在“模型編排”領(lǐng)域下的重注,那么評分機制就是Genspark在“改進循環(huán)”領(lǐng)域的一步妙手。
在Agent結(jié)構(gòu)中,評分器(Scorer)是不可或缺的模塊,它不僅是模型生成內(nèi)容的“質(zhì)量校準器”,更在Agent的動態(tài)策略調(diào)整、保障系統(tǒng)可信度、優(yōu)化任務完成效率等方面發(fā)揮著重要作用。
![]()
評估流程:從數(shù)據(jù)集中取樣本,輸入到應用,獲得輸出,然后由評估器(可結(jié)合真實答案)對輸出進行打分,從而完成對產(chǎn)品的評估。 圖片來源:LangChain
不過,?前Agent領(lǐng)域的?個核?問題是到底什么是可以被評分的。
比如在醫(yī)療和法律領(lǐng)域,有?批評某些評估?法過于簡單,?如通過律師資格考試并不等于成為?名真正的律師,通過醫(yī)學考試也不意味著能勝任醫(yī)?的?作。
和很多Agent產(chǎn)品一樣,Genspark同樣使用大模型作為“評分器”來評估整個代理會話,并生成整體獎勵。然而,Genspark將這些獎勵歸因于會話中的每個步驟,這種細致的反饋(改進循環(huán))能夠準確揭示哪些工具在哪些情況下最有效。
![]()
圖片來源:朱凱華《Less Control, More Tools: How Genspark Built a Super Agent That Scales》演講
具體而言,Genspark的評分器則建立了多維度動態(tài)評分機制,在任務執(zhí)行過程中持續(xù)評估中間輸出(如PPT大綱結(jié)構(gòu)合理性),動態(tài)調(diào)整后續(xù)生成策略;同時還內(nèi)置了消費電子、醫(yī)療等垂直領(lǐng)域的知識圖譜等10多個專業(yè)數(shù)據(jù)集,可以檢測輸出內(nèi)容與行業(yè)常識的沖突。端到端的閉環(huán)評估系統(tǒng)則可以通過多Agent協(xié)同評分、可解釋性報告生成等方式增強評分的準確性。
3.去中心化的AI系統(tǒng)設(shè)計哲學
工具集的數(shù)量也是Genspark的一個亮點,Genspark Super Agent集成了80多個工具集。
AI Agent產(chǎn)品調(diào)用的工具大約是10~15個,如果調(diào)用的工具增多,會拖慢Agent的運行速度。此前OpenAI Agent產(chǎn)品負責人Nikunj就曾在訪談中表示,Agent下?步的發(fā)展?向是如何突破?前10~15個?具的限制,即如何讓Agent 接?數(shù)百個?具,并能夠?主判斷調(diào)?哪個?具、如何使?它們。
![]()
Agent調(diào)用工具步驟越多,得分越低,圖片來源:CLUE中文語言理解測評基準
而Genspark內(nèi)部集成了80多個工具集,包含Python 解釋器、幻燈片制作器、Crunchbase API、視頻生成器、圖像生成器、數(shù)據(jù)庫連接器、分析平臺等,在增強了智能體功能豐富性的同時,卻并沒有拖慢Agent的運行時間。這不僅得益于其MoA架構(gòu)的分工協(xié)作,更是得益于他們的智能預篩選、分層搜索策略、懶加載優(yōu)化和工程化優(yōu)化策略。
實質(zhì)上,Genspark并非簡單地“承載”這些工具集,而是構(gòu)建了一個智能的工具管理和調(diào)度系統(tǒng)。這就像一個智能倉庫,雖然有80種商品,但機器人不是盲目搜索全部,而是根據(jù)訂單快速定位到相關(guān)區(qū)域,只檢查最可能的5~8個選項。
朱凱華認為,在設(shè)計工具集時,最重要的考慮因素是可組合性。每個工具都應提供簡潔、文檔齊全的API。就像搭建樂高積木一樣——每個積木塊都應該與其他積木塊無縫連接,這讓Agent系統(tǒng)能夠以人從未預料到的方式自動選擇和組合工具。能夠做到這一點的公司不僅擁有工具,還擁有一個工具生態(tài)系統(tǒng)。
![]()
圖源:Kay Zhu《Less Control, More Tools: How Genspark Built a Super Agent That Scales》演講
“我們相信工具具有網(wǎng)絡效應,Genspark技術(shù)架構(gòu)的關(guān)鍵在于每增加一個新工具并非僅僅增加一項功能,而是與所有現(xiàn)有的工具形成指數(shù)級組合——工具A的輸出可以輸入到工具B,而工具B又可以與工具C結(jié)合。”朱凱華在演講中表示。
“Less Control, More Tools” 體現(xiàn)出一種去中心化的AI系統(tǒng)設(shè)計哲學。
Genspark Super Agent的突破正在于此。它把控制權(quán)交給系統(tǒng)自身的反饋循環(huán),用“工具的多樣性”和“協(xié)作的智能性”取代“人為的流程控制”,最終實現(xiàn)可擴展、自優(yōu)化的超級智能體。
這不僅是技術(shù)架構(gòu)的升級,更是思維方式的轉(zhuǎn)變。
自4月上線以來,Genspark Super Agent幾乎以“每周一更”的瘋狂節(jié)奏推進更新。本月初,Genspark推出了“Photo Genius(圖片大師)”功能,將圖片編輯帶入全新的“口述即編輯”體驗,用戶可以用語音控制美顏,實現(xiàn)風格即時切換、場景魔術(shù)切換、照片拯救、合影魔術(shù)等。
![]()
Photo Genius,圖片來源:Genspark
過去,我們崇拜“大模型”:GPT、Claude、Gemini。
但未來,我們需要更重視“系統(tǒng)”:誰能把這些模型組織成高效、穩(wěn)定、自優(yōu)化的智能體系統(tǒng),誰才真正掌握了AI生產(chǎn)力的鑰匙。
AI Agent產(chǎn)業(yè)的競爭格局正在轉(zhuǎn)變:從模型競爭到系統(tǒng)競爭;從算法思維到工程思維;從賣功能到賣結(jié)果。
Genspark的MoA架構(gòu),讓人看到了“新一代AI Agent系統(tǒng)”前景。
當然,它仍有風險與挑戰(zhàn)——模型調(diào)用成本高、任務調(diào)度復雜、可解釋性與一致性問題仍未徹底解決。
我們認為,AI Agent未來要面臨的,不是算法的極限,而是系統(tǒng)的邊界。而Genspark正在擴張的,正是這種邊界。
(封面圖來源:使用Genspark生成)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.