<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      AI智能體不是越多越強(qiáng):信息冗余構(gòu)成了LLM Agent Scaling的瓶頸

      0
      分享至



      近年來,基于大語言模型的多智能體系統(tǒng)(LLM-based Multi-Agent Systems, MAS)被廣泛用于復(fù)雜推理任務(wù)。典型做法是讓多個(gè) agent 獨(dú)立生成并通過投票或辯論等機(jī)制聚合決策,從而在算術(shù)推理、常識(shí)推斷與專業(yè)問答中提升準(zhǔn)確率。

      隨著 test-time compute(推理時(shí)計(jì)算)成為常見的能力提升手段,一個(gè)自然的問題隨之出現(xiàn):MAS 是否能通過不斷增加 agent 數(shù)量而持續(xù)變強(qiáng)?直覺上,這個(gè)設(shè)想似乎成立:類似 ensemble 或 self-consistency 的「多次采樣 + 聚合」往往能提高覆蓋正確答案的概率。

      來自上海交通大學(xué)、UC Berkeley、加州理工學(xué)院以及約翰?霍普金斯大學(xué)的聯(lián)合研究論文Understanding Agent Scaling in LLM-Based Multi-Agent Systems via Diversity 表明:多智能體系統(tǒng)「擴(kuò)不動(dòng)」的真正原因,并不是 Agent 不夠多,而是信息冗余。 系統(tǒng)實(shí)驗(yàn)發(fā)現(xiàn),單純堆規(guī)模收益迅速枯竭,而引入多樣性可以顯著延緩飽和、以更少的 Agent 獲得更強(qiáng)的性能。



      • 論文標(biāo)題:Understanding Agent Scaling in LLM-Based Multi-Agent Systems via Diversity
      • 論文地址:https://arxiv.org/pdf/2602.03794
      • GitHub 代碼:https://github.com/SafeRL-Lab/Agent-Scaling

      同質(zhì)擴(kuò)展的失效:

      規(guī)模帶來的收益迅速飽和

      論文首先直接檢驗(yàn)「增加 agent 數(shù)是否有效」。在同質(zhì)設(shè)置下,所有 agent 共享相同底座模型與系統(tǒng)提示(無 persona 差異,配置一致),采用兩類常見協(xié)作機(jī)制:

      • Vote:?jiǎn)屋啰?dú)立生成后多數(shù)投票;
      • Debate:多輪交互后再給出最終答案(交互 4 輪)。

      僅改變 agent 數(shù) N,在 7 個(gè)基準(zhǔn)任務(wù)(GSM8K、ARC、Formal Logic、TruthfulQA、HellaSwag、WinoGrande、Pro Medicine)上評(píng)估。



      結(jié)果在不同任務(wù)與模型上高度一致:當(dāng) N 從 1 增至 2 或 4 時(shí),性能通常明顯提升;但繼續(xù)增加 N 后,準(zhǔn)確率迅速進(jìn)入平臺(tái)期,邊際收益接近 0,部分設(shè)置甚至出現(xiàn)回落。這說明:在同質(zhì)配置下,單純堆疊更多 agent calls 并不能持續(xù)注入新的有效信息。

      多樣性帶來的對(duì)照現(xiàn)象:

      少量異質(zhì) agent 勝過大規(guī)模同質(zhì)系統(tǒng)

      與同質(zhì)擴(kuò)展的快速飽和形成鮮明對(duì)比的是,多樣性配置下的實(shí)驗(yàn)結(jié)果。論文進(jìn)一步比較了兩類系統(tǒng):一類由同一模型多次獨(dú)立運(yùn)行構(gòu)成,另一類則由不同 backbone 模型或不同 persona prompt 組成。在匹配計(jì)算預(yù)算(固定總 agent calls)的前提下,異質(zhì)系統(tǒng)在同預(yù)算下整體更高,并且在更大的 N 上仍能保持增益。





      為了更系統(tǒng)地理解這一現(xiàn)象,作者在實(shí)驗(yàn)中將多樣性拆解為不同來源,包括 persona 多樣性、模型多樣性,以及二者結(jié)合的完全多樣性,并在統(tǒng)一設(shè)置下進(jìn)行對(duì)比。

      在 GSM8K、ARC、HellaSwag、TruthfulQA 等七個(gè)基準(zhǔn)任務(wù)上,作者系統(tǒng)比較了:

      • Agent 完全一致(L1)
      • Agent Persona 多樣性(L2)
      • Base Model 多樣性(L3)
      • Persona多樣性兼Base Model多樣性(L4)

      結(jié)果顯示,每引入一層新的多樣性,系統(tǒng)整體性能都會(huì)顯著上移;其中,模型多樣性和 persona 多樣性各自都具有獨(dú)立貢獻(xiàn),而二者結(jié)合時(shí)效果最為顯著。



      這一趨勢(shì)在效率層面體現(xiàn)得尤為明顯:在多個(gè)任務(wù)上,僅使用2 個(gè)完全異質(zhì)的 agent,就可以達(dá)到甚至超過16 個(gè)同質(zhì) agent的平均性能。



      限制多智能體擴(kuò)展的不是規(guī)模

      而是信息冗余

      將這些實(shí)驗(yàn)結(jié)果串聯(lián)起來,論文在經(jīng)驗(yàn)層面得出了一個(gè)清晰結(jié)論:多智能體系統(tǒng)的擴(kuò)展瓶頸并不來自 agent 數(shù)量不足,而來自 agent 輸出之間的高度相關(guān)性。在同質(zhì)配置下,多個(gè) agent 往往沿著相似的推理路徑生成答案,新增調(diào)用所帶來的大多是重復(fù)信息;而多樣性的作用,在于引入互補(bǔ)視角,降低輸出冗余,使系統(tǒng)能夠在相同甚至更小的計(jì)算預(yù)算下獲得更多有效證據(jù)。





      基于這一系列實(shí)驗(yàn)現(xiàn)象,作者進(jìn)一步提出信息論分析框架,引入「有效信息通道」等概念,對(duì)「規(guī)模失效」與「多樣性優(yōu)勢(shì)」給出統(tǒng)一解釋。與其說這項(xiàng)工作提出了新的 agent 架構(gòu),不如說它明確指出:多智能體系統(tǒng)里真正稀缺的資源不是調(diào)用次數(shù),而是非冗余的信息來源

      信息論視角:

      性能由「有效信息」而非「調(diào)用次數(shù)」主導(dǎo)

      作者考慮一個(gè)包含 N 個(gè)大模型智能體的多智能體系統(tǒng),每個(gè)智能體具有自身配置,包括基座模型(backbone model)、系統(tǒng)提示詞(system prompt)、角色設(shè)定(persona)與工具能力(tool access)。系統(tǒng)接收問題輸入 X,按預(yù)設(shè)工作流執(zhí)行若干次推理(記為 n 次),最終輸出答案。



      從信息論角度,得到正確答案 Y 的成功率并不簡(jiǎn)單由 N 與 n 決定,而取決于系統(tǒng)能夠提供多少關(guān)于 Y 的信息。作者用條件熵 H (Y|X) 刻畫任務(wù)的內(nèi)在難度:在給定問題 X 的情況下,正確答案 Y 仍然存在的剩余不確定性。

      • 同質(zhì)配置下,即便新增智能體,往往也只是在相似推理路徑下重復(fù)采樣,因而對(duì)降低不確定性幫助有限;
      • 異質(zhì)配置下,新增智能體更可能引入新的推理路徑,與既有路徑互補(bǔ),從而更有效地減少不確定性。

      為刻畫這一差異,作者定義:



      在該設(shè)定下,作者基于若干建模假設(shè)推導(dǎo)出一個(gè)近似形式,用于刻畫趨勢(shì)而非精確預(yù)測(cè)。作者認(rèn)為,系統(tǒng)可獲得的有效信息量(并據(jù)此關(guān)聯(lián)成功率)主要受如下量支配:



      該結(jié)果強(qiáng)調(diào):影響系統(tǒng)性能的關(guān)鍵不在于 “智能體數(shù)量或推理次數(shù)”,而在于系統(tǒng)中有效信息通道的數(shù)量—— 也就是多樣化所帶來的非冗余信息規(guī)模。它也解釋了為何實(shí)踐中常見「邊際效益遞減」:當(dāng)有效信息通道增長(zhǎng)受限時(shí),新增調(diào)用帶來的有效信息增量會(huì)快速衰減。

      作者還給出了在實(shí)踐中估計(jì)有效信息通道 K 的方法,并在 GSM8K、ARC、Formal Logic、HellaSwag、WinoGrande、Pro Medicine 等數(shù)據(jù)集上驗(yàn)證:經(jīng)驗(yàn)成功率與理論預(yù)測(cè)總體吻合。



      進(jìn)一步地,作者將系統(tǒng)輸出拆分為「正確推理路徑」與「錯(cuò)誤推理路徑」,分別估算其對(duì)應(yīng)的有效信息通道數(shù)量。實(shí)驗(yàn)一致表明:當(dāng)正確推理路徑對(duì)應(yīng)的有效信息通道更多時(shí),多智能體系統(tǒng)表現(xiàn)更好。這意味著系統(tǒng)設(shè)計(jì)不應(yīng)盲目追求多樣性本身,而應(yīng)追求與任務(wù)相關(guān)的推理多樣性 —— 即提升與正確推理相關(guān)的有效信息通道數(shù)。



      總結(jié)

      論文的核心經(jīng)驗(yàn)結(jié)論是:多智能體擴(kuò)展的關(guān)鍵不在于把 N 做大,而在于讓新增調(diào)用帶來新的有效證據(jù)。只要輸出高度相關(guān),同質(zhì)擴(kuò)展就會(huì)很快進(jìn)入平臺(tái)期;而多樣性能夠提升效率,是因?yàn)樗赡墚a(chǎn)生互補(bǔ)推理路徑。換句話說,多智能體系統(tǒng)里稀缺的不是調(diào)用次數(shù),而是非冗余信息。

      實(shí)踐上可以用一個(gè)簡(jiǎn)單標(biāo)準(zhǔn)指導(dǎo)擴(kuò)展:當(dāng)增加 agent 主要帶來「同一思路的重復(fù)」 時(shí),應(yīng)停止堆同質(zhì)數(shù)量,轉(zhuǎn)而引入可控的異質(zhì)性(方法互補(bǔ)的 persona、不同模型家族、工具能力互補(bǔ));只有當(dāng)這些改動(dòng)確實(shí)帶來額外增益時(shí),再繼續(xù)擴(kuò)大規(guī)模。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      世界第二爆冷!2-3惜敗早田,國(guó)乒女單6人出局懸念拉滿

      世界第二爆冷!2-3惜敗早田,國(guó)乒女單6人出局懸念拉滿

      卿子書
      2026-02-27 08:26:14
      深圳灣公園晚上“黑燈瞎火”被吐槽,公園管理中心回應(yīng):為了讓鳥兒睡好覺,主要出入口等地保留了基礎(chǔ)照明

      深圳灣公園晚上“黑燈瞎火”被吐槽,公園管理中心回應(yīng):為了讓鳥兒睡好覺,主要出入口等地保留了基礎(chǔ)照明

      揚(yáng)子晚報(bào)
      2026-02-27 12:33:02
      美媒:臺(tái)積電既不能向中國(guó)大陸出口芯片,也不能賣芯片給美國(guó)

      美媒:臺(tái)積電既不能向中國(guó)大陸出口芯片,也不能賣芯片給美國(guó)

      皇朝冰酷
      2026-02-27 13:27:20
      2026年,各國(guó)領(lǐng)導(dǎo)人都多少歲了,馬克龍48,普京73,特朗普近80

      2026年,各國(guó)領(lǐng)導(dǎo)人都多少歲了,馬克龍48,普京73,特朗普近80

      小陸搞笑日常
      2026-02-26 18:24:58
      朝鮮司機(jī)首次來華,十公里路嚇出冷汗,直呼:這也太快了!

      朝鮮司機(jī)首次來華,十公里路嚇出冷汗,直呼:這也太快了!

      冒泡泡的魚兒
      2026-02-27 13:45:41
      米蘭時(shí)裝周:谷愛凌遭九旬老頭摟腰摸手,媽媽臉色勉強(qiáng),網(wǎng)友怒了

      米蘭時(shí)裝周:谷愛凌遭九旬老頭摟腰摸手,媽媽臉色勉強(qiáng),網(wǎng)友怒了

      小徐講八卦
      2026-02-27 06:17:21
      突然大跳水!暴跌87%

      突然大跳水!暴跌87%

      常州大喇叭
      2026-02-26 16:59:40
      在七千多的養(yǎng)老院住了一年才明白:再貴的養(yǎng)老院,也買不來這3樣

      在七千多的養(yǎng)老院住了一年才明白:再貴的養(yǎng)老院,也買不來這3樣

      小馬達(dá)情感故事
      2026-02-10 11:50:09
      徹底癱瘓!兩年了為何許家印遲遲不判刑?真相比你想象的更復(fù)雜

      徹底癱瘓!兩年了為何許家印遲遲不判刑?真相比你想象的更復(fù)雜

      歷史偉人錄
      2026-02-24 18:19:45
      重要調(diào)整!央視直播新加坡大滿貫有變,孫穎莎張本智和上上簽

      重要調(diào)整!央視直播新加坡大滿貫有變,孫穎莎張本智和上上簽

      極度說球
      2026-02-27 12:27:19
      兩位英雄駕機(jī)撞向俄軍!不是所有烏克蘭人都是扎波羅熱哥薩克的種

      兩位英雄駕機(jī)撞向俄軍!不是所有烏克蘭人都是扎波羅熱哥薩克的種

      鷹眼Defence
      2026-02-27 12:55:26
      奧運(yùn)冠軍占旭剛,當(dāng)選新職

      奧運(yùn)冠軍占旭剛,當(dāng)選新職

      上觀新聞
      2026-02-27 11:19:10
      奧尼爾0.9秒絕殺!湖人更衣室內(nèi)訌!里夫斯2.4億合同泡湯

      奧尼爾0.9秒絕殺!湖人更衣室內(nèi)訌!里夫斯2.4億合同泡湯

      籃球教學(xué)論壇
      2026-02-27 14:49:39
      越干凈越易過敏?Nature研究揭示:環(huán)境的“臟”在默默訓(xùn)練你的免疫系統(tǒng)

      越干凈越易過敏?Nature研究揭示:環(huán)境的“臟”在默默訓(xùn)練你的免疫系統(tǒng)

      生物世界
      2026-02-26 12:06:47
      華為算力概念股,集體拉升

      華為算力概念股,集體拉升

      第一財(cái)經(jīng)資訊
      2026-02-27 10:13:19
      連續(xù)7個(gè)漲停板!股民:排了一天都排不進(jìn)去!

      連續(xù)7個(gè)漲停板!股民:排了一天都排不進(jìn)去!

      數(shù)據(jù)挖掘分析
      2026-02-27 15:12:17
      豪取11連勝,打破NBA塵封79年神紀(jì)錄!3大細(xì)節(jié)證明圣城馬刺回來了

      豪取11連勝,打破NBA塵封79年神紀(jì)錄!3大細(xì)節(jié)證明圣城馬刺回來了

      鍋?zhàn)踊@球
      2026-02-27 14:55:39
      一級(jí)軍士長(zhǎng)的地位有多高?相當(dāng)于什么級(jí)別?為何師長(zhǎng)見了都得敬禮

      一級(jí)軍士長(zhǎng)的地位有多高?相當(dāng)于什么級(jí)別?為何師長(zhǎng)見了都得敬禮

      觀銳器
      2026-02-26 22:20:40
      林徽因落選的國(guó)徽方案,網(wǎng)友看后感嘆:審美確實(shí)一絕,但真不合適

      林徽因落選的國(guó)徽方案,網(wǎng)友看后感嘆:審美確實(shí)一絕,但真不合適

      抽象派大師
      2026-01-03 02:13:54
      開始搶人!美國(guó)一周挖走4名中國(guó)頂尖人才,年薪1個(gè)億美元令人咋舌

      開始搶人!美國(guó)一周挖走4名中國(guó)頂尖人才,年薪1個(gè)億美元令人咋舌

      古史青云啊
      2026-02-26 19:45:46
      2026-02-27 16:55:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12374文章數(shù) 142570關(guān)注度
      往期回顧 全部

      科技要聞

      單張不到五毛!谷歌深夜發(fā)布Nano Banana 2

      頭條要聞

      24歲女子生下1男4女五胞胎 孩子爸爸稱"心情像過山車"

      頭條要聞

      24歲女子生下1男4女五胞胎 孩子爸爸稱"心情像過山車"

      體育要聞

      一場(chǎng)必須要贏的比賽,男籃何止擊敗了裁判

      娛樂要聞

      繼網(wǎng)暴谷愛凌后 美國(guó)欲沒收其全部收入

      財(cái)經(jīng)要聞

      沈明高提共富建議 百姓持科技股國(guó)家兜底

      汽車要聞

      嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

      態(tài)度原創(chuàng)

      藝術(shù)
      手機(jī)
      親子
      家居
      軍事航空

      藝術(shù)要聞

      紫氣東來,好運(yùn)一整年!

      手機(jī)要聞

      消息稱榮耀600系列工程機(jī)現(xiàn)身:采用6.57英寸直屏+驍龍8至尊版

      親子要聞

      馬上要到美國(guó)家族大聚餐了,上次遺憾沒帶中餐,這次準(zhǔn)備啥菜合適

      家居要聞

      素色肌理 品意式格調(diào)

      軍事要聞

      美國(guó)11架F-22隱形戰(zhàn)機(jī)抵達(dá)以色列

      無障礙瀏覽 進(jìn)入關(guān)懷版