<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌MIT聯手:首個智能體Scaling Law出爐,盲目堆Agent性能暴跌70%

      0
      分享至


      ↑閱讀之前記得關注+星標??,,每天才能第一時間接收到更新

      AI圈里一直流傳著一句信條:“More agents is all you need”(智能體越多越好)。

      大家的直覺很簡單:一個諸葛亮不夠,那就找三個臭皮匠來湊。甚至有人覺得,只要我把一堆AI拉進一個群里,讓它們互相討論、投票,無論什么任務都能做得更好

      但現在,Google Research、DeepMind聯合MIT的一項重磅研究,給這個想法潑了一盆冷水

      paper:

      https://arxiv.org/pdf/2512.08296


      他們做了一場史上最嚴苛的壓力測試,結果發現了一個反直覺的真相:

      盲目組建AI團隊,不僅不能提升能力,甚至可能把原本聰明的模型搞成“人工智障”,性能暴跌70%。

      為此,研究團隊總結出了一套 “智能體Scaling Law”,這是第一套能幫你算清楚“到底該單干還是群毆”的數學公式

      為了搞清楚AI協作的真相,研究人員沒有只測一種模型,而是把市面上最強的三大模型——OpenAI (GPT系列)、Google (Gemini系列)、Anthropic (Claude系列) 全部拉上了擂臺

      他們設計了180種不同的配置,不僅有單打獨斗的(單智能體),還有四種不同的“組隊模式”:

      1.各自為戰: 大家各干各的,最后湊一起。
      2.中心化指揮: 有個“經理”負責分派任務和檢查。
      3.去中心化討論:大家圍成一圈開會,互相辯論。
      4.混合模式:既有經理,底下人也能私聊

      為了公平,不管是單人還是團隊,手里能花的錢(Token預算)和能用的工具都是一樣的

      測試結果出來后,呈現出了極端的兩極分化,就像兩個平行宇宙。

      宇宙一:人多力量大

      在 金融分析(Finance-Agent)這類任務里,多智能體簡直殺瘋了

      因為金融任務可以拆得非常細,比如A查財報,B看K線,C做風控,最后匯總。在這種場景下,找個“經理”來指揮(中心化架構),性能直接比單干提升了80.9%

      宇宙二:人多即地獄

      但在“規劃任務”(PlanCraft,比如在Minecraft里合成物品)里,情況完全失控

      這類任務講究邏輯的連貫性:你得先砍樹,才能做木板,再做工作臺。步驟環環相扣

      結果研究發現,只要引入協作,所有多智能體架構全部崩盤
      因為大家七嘴八舌地討論打斷了推理的連貫性,把寶貴的計算資源都浪費在了溝通上。比起單干,性能最高暴跌了70%

      還有個中間派:

      模擬真實職場打工(Workbench)的任務,結果顯示,這就屬于費力不討好。折騰半天組建團隊,最好的結果也就提升了5.7%,甚至有的架構還倒退了

      為什么會出現這種差異?研究團隊通過那套Scaling Law公式,像法醫一樣解剖了背后的原因,找到了三條鐵律:

      鐵律1:工具越重,開會越廢(工具-協作權衡)

      想象一下,如果一個工匠要用16種不同的錘子和鋸子干活

      單干時,他拿起工具就干。但如果是個團隊,每換個工具都要跟隊友確認、同步信息

      數據顯示,任務需要的工具越多,協作帶來的內耗就越嚴重。在這種“重工具”場景下,把資源花在溝通上簡直是浪費,不如留給單人去思考

      鐵律2:高手不需要隊友(能力飽和)

      研究劃定了一條殘酷的“紅線”:45%

      如果一個單智能體自己做這道題的準確率已經超過了45%,那么給它加隊友往往是負收益

      就像學霸做題,自己做能得90分。非要給他配幾個60分的隊友在旁邊指指點點,最后成績反而會被拉低。

      鐵律3:沒經理的團隊是災難(錯誤放大)

      這是最嚇人的數據

      如果你讓一群AI各自跑結果(獨立架構),卻沒人負責檢查,錯誤率會被放大17.2倍!

      因為一個AI犯了錯,沒糾正,另一個AI接著錯,最后錯上加錯

      只有引入“中心化”的經理角色,強制進行檢查驗證,才能把錯誤控制住(只放大4.4倍)

      結論:算好這筆賬

      這項研究最大的貢獻,就是告訴大家:別迷信人海戰術了

      Google和MIT把這些發現濃縮成了一個預測模型。現在,只要你輸入三個數據:

      1. 1. 模型本身聰不聰明?

      2. 2. 任務要用多少工具?

      3. 3. 這任務能不能拆解?

      這個公式就能以87%的準確率告訴你:該單干,還是該組隊

      簡單來說,這就是一本AI算力經濟學:在預算有限的情況下,把算力花在讓一個大腦深思熟慮上,往往比讓一群大腦開會吵架更劃算——除非,你真的有一個好經理和容易拆分的任務

      --end--

      最后記得??我,每天都在更新:歡迎點贊轉發推薦評論,別忘了關注我

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      這,才是美國聽得懂的語言!

      這,才是美國聽得懂的語言!

      戎評
      2025-12-30 10:13:40
      陳偉俊,被免職

      陳偉俊,被免職

      新京報政事兒
      2025-12-30 10:56:57
      “斬殺線” 折射出美國社會什么問題?

      “斬殺線” 折射出美國社會什么問題?

      看看新聞Knews
      2025-12-29 16:09:02
      伊利拍了個“養牛爽劇”,年輕人居然追瘋了?

      伊利拍了個“養牛爽劇”,年輕人居然追瘋了?

      一點財經
      2025-12-30 12:18:25
      收評:滬指收出10連陽 機器人概念持續爆發

      收評:滬指收出10連陽 機器人概念持續爆發

      財聯社
      2025-12-30 15:02:09
      上海立信會計金融學院原黨委副書記獲刑10年2個月!

      上海立信會計金融學院原黨委副書記獲刑10年2個月!

      上觀新聞
      2025-12-30 16:32:05
      2026年第一批625億元超長期特別國債支持消費品以舊換新資金計劃已提前下達

      2026年第一批625億元超長期特別國債支持消費品以舊換新資金計劃已提前下達

      界面新聞
      2025-12-30 18:11:23
      金正恩接見女足引發爭議,朝鮮高官氣到踢了女足教練一腳

      金正恩接見女足引發爭議,朝鮮高官氣到踢了女足教練一腳

      大眼瞄世界
      2025-12-30 09:44:08
      突發,小米創始人林斌套現140億走人

      突發,小米創始人林斌套現140億走人

      電商派Pro
      2025-12-30 10:01:24
      “世界工廠”的房價失控了!

      “世界工廠”的房價失控了!

      櫻桃大房子
      2025-12-29 22:43:13
      故宮原副院長被抄家,狗窩都用和田玉

      故宮原副院長被抄家,狗窩都用和田玉

      法經網
      2025-12-29 21:01:33
      林俊杰官宣戀情不到24小時,女方被扒個底朝天,擦邊只是冰山一角

      林俊杰官宣戀情不到24小時,女方被扒個底朝天,擦邊只是冰山一角

      白面書誏
      2025-12-30 11:54:05
      談判進入“最后階段”,棘手問題尚未解決,美烏總統談了3小時仍無突破

      談判進入“最后階段”,棘手問題尚未解決,美烏總統談了3小時仍無突破

      環球網資訊
      2025-12-30 07:02:23
      陳云水辭去有關職務,曾任福州市委副書記(附簡歷)

      陳云水辭去有關職務,曾任福州市委副書記(附簡歷)

      金臺資訊
      2025-12-30 16:32:34
      重慶市紀委監委公開通報四起違反中央八項規定精神典型問題

      重慶市紀委監委公開通報四起違反中央八項規定精神典型問題

      新京報政事兒
      2025-12-30 16:21:20
      北方家庭買PHEV最大的顧慮,被一款車系統性地解決了?

      北方家庭買PHEV最大的顧慮,被一款車系統性地解決了?

      汽車通訊社
      2025-12-29 18:14:24
      家長參與護學崗時突然倒地,送醫急救;張家界永定區教育局:正牽頭處置,會發通報

      家長參與護學崗時突然倒地,送醫急救;張家界永定區教育局:正牽頭處置,會發通報

      大風新聞
      2025-12-30 10:22:02
      微軟新研究:這40種工作最可能被AI取代

      微軟新研究:這40種工作最可能被AI取代

      量子位
      2025-08-03 10:53:11
      東部戰區軍演針對誰?美日媒體都認為是對方,國臺辦一句話定基調

      東部戰區軍演針對誰?美日媒體都認為是對方,國臺辦一句話定基調

      時時有聊
      2025-12-30 07:48:36
      633元羽絨服女子回應:衣服只穿一次,網友曬鐵證,不止穿過一次

      633元羽絨服女子回應:衣服只穿一次,網友曬鐵證,不止穿過一次

      奇思妙想草葉君
      2025-12-29 23:38:44
      2025-12-30 18:44:49
      AI寒武紀 incentive-icons
      AI寒武紀
      專注于人工智能,科技領域
      1024文章數 393關注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開始批量"制造"小獨角獸

      頭條要聞

      副局長婚內與異性開房 前妻向紀委舉報其違規接受宴請

      頭條要聞

      副局長婚內與異性開房 前妻向紀委舉報其違規接受宴請

      體育要聞

      這個59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰女友被扒 父親涉經濟案卷款13億?

      財經要聞

      朱光耀:美關稅政策正使WTO名存實亡

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態度原創

      藝術
      健康
      親子
      家居
      游戲

      藝術要聞

      謝稚柳雪景山水20圖

      這些新療法,讓化療不再那么痛苦

      親子要聞

      寶藍和爸爸、叔叔一起逛游樂園,拍照打卡、品嘗美食,太好玩了!

      家居要聞

      當歸之宅 三胎圓滿居所

      重大版本更新來了!《燕云》周年慶、《劍網3無界》聯動經典IP

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品人妻在线观看| 亚洲国产欧美在线看片一国产| 久久亚洲精品成人无码网站| 中文一区二区视频| 91视频免费| 国产成人无码av一区二区在线观看 | 日韩一级亚洲一午夜免费观看中文版国语版 | 中文a片| 久久婷婷丁香五月综合五| 成年男女免费视频网站| 中文字幕一二区| 欧美日韩在线视频| 国产无遮挡又黄又爽高潮| 成熟女人特级毛片www免费| 91狠狠爱| 粉嫩av懂色av蜜臀av熟妇| 久久精品久久久久观看99水蜜桃| 人妻无码视频一区二区三区 | 久久无码人妻热线精品| 色吊丝中文字幕| 性按摩玩人妻hd中文字幕| 日本视频高清一区二区三区| 欧美成人片在线观看| 亚洲人成网站色7799| 欧洲一区二区三区| 动性与另类XXXXX杂性| 97久久精品无码一区二区天美| 日韩伊人| 国产中文| 一级片免费网站| 久久久精品波多野结衣av| 屏山县| 江达县| 茶陵县| 91精品国产免费人成网站| 久久婷婷五月综合色欧美| 免费无码专区毛片高潮喷水| 内射老妇bbwx0c0ck| 人妻aⅴ无码一区二区三区| 亚洲中文字幕日韩精品| 99re免费|