<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      谷歌MIT聯(lián)手:首個(gè)智能體Scaling Law出爐,盲目堆Agent性能暴跌70%

      0
      分享至


      ↑閱讀之前記得關(guān)注+星標(biāo)??,,每天才能第一時(shí)間接收到更新

      AI圈里一直流傳著一句信條:“More agents is all you need”(智能體越多越好)。

      大家的直覺很簡單:一個(gè)諸葛亮不夠,那就找三個(gè)臭皮匠來湊。甚至有人覺得,只要我把一堆AI拉進(jìn)一個(gè)群里,讓它們互相討論、投票,無論什么任務(wù)都能做得更好

      但現(xiàn)在,Google Research、DeepMind聯(lián)合MIT的一項(xiàng)重磅研究,給這個(gè)想法潑了一盆冷水

      paper:

      https://arxiv.org/pdf/2512.08296


      他們做了一場史上最嚴(yán)苛的壓力測試,結(jié)果發(fā)現(xiàn)了一個(gè)反直覺的真相:

      盲目組建AI團(tuán)隊(duì),不僅不能提升能力,甚至可能把原本聰明的模型搞成“人工智障”,性能暴跌70%。

      為此,研究團(tuán)隊(duì)總結(jié)出了一套 “智能體Scaling Law”,這是第一套能幫你算清楚“到底該單干還是群毆”的數(shù)學(xué)公式

      為了搞清楚AI協(xié)作的真相,研究人員沒有只測一種模型,而是把市面上最強(qiáng)的三大模型——OpenAI (GPT系列)、Google (Gemini系列)、Anthropic (Claude系列) 全部拉上了擂臺

      他們設(shè)計(jì)了180種不同的配置,不僅有單打獨(dú)斗的(單智能體),還有四種不同的“組隊(duì)模式”:

      1.各自為戰(zhàn): 大家各干各的,最后湊一起。
      2.中心化指揮: 有個(gè)“經(jīng)理”負(fù)責(zé)分派任務(wù)和檢查。
      3.去中心化討論:大家圍成一圈開會,互相辯論。
      4.混合模式:既有經(jīng)理,底下人也能私聊

      為了公平,不管是單人還是團(tuán)隊(duì),手里能花的錢(Token預(yù)算)和能用的工具都是一樣的

      測試結(jié)果出來后,呈現(xiàn)出了極端的兩極分化,就像兩個(gè)平行宇宙。

      宇宙一:人多力量大

      在 金融分析(Finance-Agent)這類任務(wù)里,多智能體簡直殺瘋了

      因?yàn)榻鹑谌蝿?wù)可以拆得非常細(xì),比如A查財(cái)報(bào),B看K線,C做風(fēng)控,最后匯總。在這種場景下,找個(gè)“經(jīng)理”來指揮(中心化架構(gòu)),性能直接比單干提升了80.9%

      宇宙二:人多即地獄

      但在“規(guī)劃任務(wù)”(PlanCraft,比如在Minecraft里合成物品)里,情況完全失控

      這類任務(wù)講究邏輯的連貫性:你得先砍樹,才能做木板,再做工作臺。步驟環(huán)環(huán)相扣

      結(jié)果研究發(fā)現(xiàn),只要引入?yún)f(xié)作,所有多智能體架構(gòu)全部崩盤
      因?yàn)榇蠹移咦彀松嗟赜懻摯驍嗔送评淼倪B貫性,把寶貴的計(jì)算資源都浪費(fèi)在了溝通上。比起單干,性能最高暴跌了70%

      還有個(gè)中間派:

      模擬真實(shí)職場打工(Workbench)的任務(wù),結(jié)果顯示,這就屬于費(fèi)力不討好。折騰半天組建團(tuán)隊(duì),最好的結(jié)果也就提升了5.7%,甚至有的架構(gòu)還倒退了

      為什么會出現(xiàn)這種差異?研究團(tuán)隊(duì)通過那套Scaling Law公式,像法醫(yī)一樣解剖了背后的原因,找到了三條鐵律:

      鐵律1:工具越重,開會越廢(工具-協(xié)作權(quán)衡)

      想象一下,如果一個(gè)工匠要用16種不同的錘子和鋸子干活

      單干時(shí),他拿起工具就干。但如果是個(gè)團(tuán)隊(duì),每換個(gè)工具都要跟隊(duì)友確認(rèn)、同步信息

      數(shù)據(jù)顯示,任務(wù)需要的工具越多,協(xié)作帶來的內(nèi)耗就越嚴(yán)重。在這種“重工具”場景下,把資源花在溝通上簡直是浪費(fèi),不如留給單人去思考

      鐵律2:高手不需要隊(duì)友(能力飽和)

      研究劃定了一條殘酷的“紅線”:45%

      如果一個(gè)單智能體自己做這道題的準(zhǔn)確率已經(jīng)超過了45%,那么給它加隊(duì)友往往是負(fù)收益

      就像學(xué)霸做題,自己做能得90分。非要給他配幾個(gè)60分的隊(duì)友在旁邊指指點(diǎn)點(diǎn),最后成績反而會被拉低。

      鐵律3:沒經(jīng)理的團(tuán)隊(duì)是災(zāi)難(錯(cuò)誤放大)

      這是最嚇人的數(shù)據(jù)

      如果你讓一群AI各自跑結(jié)果(獨(dú)立架構(gòu)),卻沒人負(fù)責(zé)檢查,錯(cuò)誤率會被放大17.2倍!

      因?yàn)橐粋€(gè)AI犯了錯(cuò),沒糾正,另一個(gè)AI接著錯(cuò),最后錯(cuò)上加錯(cuò)

      只有引入“中心化”的經(jīng)理角色,強(qiáng)制進(jìn)行檢查驗(yàn)證,才能把錯(cuò)誤控制住(只放大4.4倍)

      結(jié)論:算好這筆賬

      這項(xiàng)研究最大的貢獻(xiàn),就是告訴大家:別迷信人海戰(zhàn)術(shù)了

      Google和MIT把這些發(fā)現(xiàn)濃縮成了一個(gè)預(yù)測模型。現(xiàn)在,只要你輸入三個(gè)數(shù)據(jù):

      1. 1. 模型本身聰不聰明?

      2. 2. 任務(wù)要用多少工具?

      3. 3. 這任務(wù)能不能拆解?

      這個(gè)公式就能以87%的準(zhǔn)確率告訴你:該單干,還是該組隊(duì)

      簡單來說,這就是一本AI算力經(jīng)濟(jì)學(xué):在預(yù)算有限的情況下,把算力花在讓一個(gè)大腦深思熟慮上,往往比讓一群大腦開會吵架更劃算——除非,你真的有一個(gè)好經(jīng)理和容易拆分的任務(wù)

      --end--

      最后記得??我,每天都在更新:歡迎點(diǎn)贊轉(zhuǎn)發(fā)推薦評論,別忘了關(guān)注我

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      反轉(zhuǎn)了!臭豆腐賠償?shù)轿淮箢^被捐,女兒成眾矢之的,再找工作難了

      反轉(zhuǎn)了!臭豆腐賠償?shù)轿淮箢^被捐,女兒成眾矢之的,再找工作難了

      離離言幾許
      2026-03-01 12:08:32
      美以對伊朗動手,俄羅斯、歐盟、巴基斯坦等多方發(fā)聲

      美以對伊朗動手,俄羅斯、歐盟、巴基斯坦等多方發(fā)聲

      參考消息
      2026-02-28 22:08:44
      砍9分11籃板!中國男籃1米98奇兵正負(fù)值+21:郭士強(qiáng)用對他

      砍9分11籃板!中國男籃1米98奇兵正負(fù)值+21:郭士強(qiáng)用對他

      李喜林籃球絕殺
      2026-03-01 18:48:10
      狗咬人被摔死,狗主人帶9人復(fù)仇被60歲老人反殺!是正當(dāng)防衛(wèi)嗎?

      狗咬人被摔死,狗主人帶9人復(fù)仇被60歲老人反殺!是正當(dāng)防衛(wèi)嗎?

      何慕白
      2025-11-13 10:22:09
      椰樹太顛了!代言人婚紗照成網(wǎng)紅打卡地,“土味營銷”天花板!

      椰樹太顛了!代言人婚紗照成網(wǎng)紅打卡地,“土味營銷”天花板!

      LOGO研究所
      2026-03-01 11:19:49
      周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

      周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

      春江財(cái)富
      2026-03-01 08:39:41
      7億成本,《鏢人》虧損2億,吳京不服氣,一口氣立項(xiàng)了7部武俠片

      7億成本,《鏢人》虧損2億,吳京不服氣,一口氣立項(xiàng)了7部武俠片

      電影票房預(yù)告片
      2026-02-26 23:39:18
      你有知道哪些炸裂的秘密?網(wǎng)友:我有個(gè)秘密說出來肯定大家要笑死

      你有知道哪些炸裂的秘密?網(wǎng)友:我有個(gè)秘密說出來肯定大家要笑死

      帶你感受人間冷暖
      2026-01-29 00:10:05
      潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復(fù)仇”了

      潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復(fù)仇”了

      墨印齋
      2026-02-26 08:32:20
      金靖自曝過完年胖了6斤,怎么工作啊,網(wǎng)友調(diào)侃年味都長身上了

      金靖自曝過完年胖了6斤,怎么工作啊,網(wǎng)友調(diào)侃年味都長身上了

      韓小娛
      2026-03-01 09:57:40
      中東局勢升級 金價(jià)重回1600元 專家提醒:建議投資者逢高少量減持

      中東局勢升級 金價(jià)重回1600元 專家提醒:建議投資者逢高少量減持

      封面新聞
      2026-03-01 22:14:05
      抵債的方式能有多離譜?網(wǎng)友:賠了我八個(gè)車位

      抵債的方式能有多離譜?網(wǎng)友:賠了我八個(gè)車位

      另子維愛讀史
      2026-02-28 20:39:11
      網(wǎng)紅民宿降價(jià)也無人問津?這屆“摳門”的年輕人擠爆體制內(nèi)招待所

      網(wǎng)紅民宿降價(jià)也無人問津?這屆“摳門”的年輕人擠爆體制內(nèi)招待所

      藍(lán)鯨新聞
      2026-02-24 16:03:06
      中領(lǐng)館提醒: 18-65歲在俄長期居留男性 須同意在俄軍事單位等至少服役1年

      中領(lǐng)館提醒: 18-65歲在俄長期居留男性 須同意在俄軍事單位等至少服役1年

      閃電新聞
      2026-02-26 12:46:48
      男籃世預(yù)賽晉級形勢分析!中國隊(duì)1戰(zhàn)定生死:韓國或被聯(lián)手踢出局

      男籃世預(yù)賽晉級形勢分析!中國隊(duì)1戰(zhàn)定生死:韓國或被聯(lián)手踢出局

      籃球快餐車
      2026-03-01 00:42:22
      伊朗犯下10月7日的致命失誤,導(dǎo)致其失去一切

      伊朗犯下10月7日的致命失誤,導(dǎo)致其失去一切

      山河路口
      2026-03-01 20:25:18
      鄒市明一家國外度假,冉瑩穎挑染紅發(fā)似精神小妹,軒軒180cm超帥

      鄒市明一家國外度假,冉瑩穎挑染紅發(fā)似精神小妹,軒軒180cm超帥

      瘋說時(shí)尚
      2026-03-01 11:38:45
      美伊戰(zhàn)爭進(jìn)入第二天,美軍投入大量新式武器,伊朗連射20輪導(dǎo)彈

      美伊戰(zhàn)爭進(jìn)入第二天,美軍投入大量新式武器,伊朗連射20輪導(dǎo)彈

      鐵血戰(zhàn)史1927
      2026-03-01 18:37:15
      無錫二院!你要火了!

      無錫二院!你要火了!

      無錫eTV全媒體
      2026-03-01 11:46:51
      富士康創(chuàng)始人郭臺銘:“若兩岸爆發(fā)沖突,我會誓死守護(hù)臺灣”

      富士康創(chuàng)始人郭臺銘:“若兩岸爆發(fā)沖突,我會誓死守護(hù)臺灣”

      百態(tài)人間
      2026-02-12 15:21:00
      2026-03-01 23:32:49
      AI寒武紀(jì) incentive-icons
      AI寒武紀(jì)
      專注于人工智能,科技領(lǐng)域
      1034文章數(shù) 396關(guān)注度
      往期回顧 全部

      科技要聞

      榮耀發(fā)布機(jī)器人手機(jī)、折疊屏、人形機(jī)器人

      頭條要聞

      在以貼瓷磚的中國小伙:爆炸聲在頭頂響起 真的被嚇到

      頭條要聞

      在以貼瓷磚的中國小伙:爆炸聲在頭頂響起 真的被嚇到

      體育要聞

      火箭輸給熱火:烏度卡又輸斯波教練

      娛樂要聞

      黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

      財(cái)經(jīng)要聞

      中東局勢升級 如何影響A股、黃金和原油

      汽車要聞

      理想汽車2月交付26421輛 歷史累計(jì)交付超159萬輛

      態(tài)度原創(chuàng)

      健康
      教育
      藝術(shù)
      親子
      數(shù)碼

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      教育要聞

      中考數(shù)學(xué)復(fù)習(xí),中考數(shù)學(xué)重難點(diǎn)二次函數(shù),經(jīng)典壓軸題,難度大

      藝術(shù)要聞

      2025年第二屆少兒美術(shù)教師作品展 | 油畫選刊

      親子要聞

      寧愿挨一刀也不愿順產(chǎn)?宋玉希四胎道出想剖腹產(chǎn)的原因,太不值當(dāng)

      數(shù)碼要聞

      Uperfect M140G12筆記本三屏擴(kuò)展套件,辦公好幫手!

      無障礙瀏覽 進(jìn)入關(guān)懷版