網易首頁 > 網易號 > 正文申請入駐

Anthropic工程師自曝：多智能體系統90%故障源于傳話游戲

2026-04-04 23:47:16　來源: 摸魚算法

北京舉報

分享至

2024年，某大廠把客服系統拆成8個智能體（AI Agent）流水線作業。上線首周，用戶投訴量漲了340%。問題不在模型智商——每個單拎出來都是GPT-4級別——而在它們互相傳話的方式。

這不是模型故障，是context（上下文）故障。

原文作者打了個比方：智能體A提取數據，B總結，C格式化，D發送。四個環節，每個都在"自信地編造"。到D出手時，原始意圖已經變異得面目全非。就像小時候玩的傳話游戲，但每個參與者都覺得自己是對的。

這解釋了為什么多智能體demo在 controlled scenario（受控場景）里絲滑流暢，一到生產環境就崩。

結構化交接：別讓智能體寫小作文

最天真的設計是自然語言接力。A給B發一段文字，B理解后給C發另一段。損耗率驚人。

作者提出的第一條鐵律：用JSON schema或強類型對象，別用自然語言段落。自然語言是lossy（有損）的，結構化數據才可驗證。換句話說，智能體之間不該"聊天"，該"填表"。

具體怎么做？把Agent A → Agent B → Agent C的鏈式結構，改成全部指向同一個State（狀態對象）。A寫State，B讀State寫State，C讀State寫State。鏈變輪轂，所有漂移（drift）被鎖死在單一數據源里。

Model Context Protocol（模型上下文協議，簡稱MCP）的價值就在這里。它不是工具調用協議，是共享上下文協議。每個智能體從同一個MCP服務器讀取，消除記憶偏差。

顯式失敗：拒絕比猜測更安全

第二條鐵律關乎失敗處理。當前主流做法是：輸入模糊？模型硬猜一個。這開啟了信心螺旋——猜錯了還特自信，下游智能體在此基礎上繼續猜。

作者主張顯式失敗模式（explicit failure modes）。B收到垃圾輸入，應該拒絕，而非猜測。拒絕觸發人工介入或流程回滾，猜測則把錯誤埋進系統深處。

這反直覺。產品經理愛說"優雅降級"，但多智能體系統的優雅恰恰是"不優雅地卡住"。卡住了你能看見，猜錯了你很久才發現。

人工檢查點：鏈越長，人越要介入

第三條鐵律關于人機邊界。作者沒給具體比例，但邏輯清晰：步驟越多，越需要human-in-the-loop（人在回路）。

這不是技術債，是設計選擇。某自動駕駛公司把感知-決策-執行拆成三個智能體，中間不設檢查點。測試場完美，開放道路撞了。事后復盤：感知層把卡車陰影識別為障礙物，決策層基于此規劃繞行，執行層忠實執行——三個環節都沒錯，合起來是災難。

檢查點的位置比數量更重要。作者建議放在狀態轉換的關鍵節點，而非每步都卡。

狀態管理即編排

文章收尾的論斷很狠：多智能體系統不是協調問題，是狀態管理問題。搞定狀態，編排自然成立。

這解釋了為什么LangChain、LlamaIndex等框架早期版本讓人失望——它們忙著封裝模型調用，沒解決context漂移。新一代框架如AutoGen、CrewAI開始內置狀態共享機制，但作者暗示這還不夠底層。

MCP的提出者Anthropic顯然在押注這個方向。2024年11月開源該協議時，官方示例就是多智能體共享工具上下文。三個月后，OpenAI的Agents SDK跟進類似設計。

一個細節：原文評論區有人追問"模板功能是不是也能解決FAQ重復問題"，作者沒回復。這暴露了另一個斷層——開發者還在用舊思維（模板匹配）理解新范式（狀態共享）。

如果你的多智能體系統正在生產環境抽搐，先別換模型。檢查一下：它們是在互相寫小作文，還是在同一張表上填數？

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

“Claude Code更新廢了”！思考深度降67%，無法勝任復雜工程任務

量子位 2026-04-07 14:07:07
0 跟貼 0
Claude Code一周份額，一天燒完一半？有人逆向工程發現了7個bug

機器之心Pro 2026-04-07 17:34:08
0 跟貼 0

鬼手想點誰就點誰？LaSM讓GUI智能體把注意力「收回來」

機器之心Pro 2026-04-07 14:27:35
0 跟貼 0

PMDformer：一個簡單減法實現長時序預測注意力機制糾偏

機器之心Pro 2026-04-07 13:31:21
0 跟貼 0
逼AI當山頂洞人！Claude防話癆插件爆火，網友：受夠了AI廢話

新智元 2026-04-06 17:13:12
1 跟貼 1

羅福莉：Claude訂閱封殺龍蝦背后，真正的出路不是更便宜的token

機器之心Pro 2026-04-07 10:48:02
3 跟貼 3

小鵬P7+NGP掉頭后撞花壇，人機共駕也需判斷

拜托了老司機 2026-04-06 09:57:37
9 跟貼 9
易中天，獲獎勵20萬元

極目新聞 2026-04-06 21:04:19
26180 跟貼 26180

告別昂貴賬單，Token直降68%，多智能體動態協作編程來了

機器之心Pro 2026-04-07 13:16:40
0 跟貼 0
河南小伙，被中東大佬下300輛戰車模型，全村都上了！

乘風笑浪 2026-04-06 14:56:09
3 跟貼 3
陳麗華47歲倒追遲重瑞財富傳承披露：1兒2女均在富華

極目新聞 2026-04-07 12:39:33
1721 跟貼 1721
iPhone本地跑Gemma 4火了，0 token時代還有多遠？

機器之心Pro 2026-04-07 10:52:08
1 跟貼 1
7個頂級AI集體撒謊，為救“同伴”篡改文件、偷運數據

鈦媒體APP 2026-04-07 11:01:25
0 跟貼 0
高科技武器站，全功能智能操控

六個小鈴鐺 2026-04-04 15:43:29
1 跟貼 1
風箏-鄭耀先被催婚了！一套邏輯下來，說的徐百川啞口無言

龍耀影視 2026-04-03 09:03:13
3 跟貼 3
GPT-6 曝光了，奧特曼卻成了硅谷最焦慮的人

AppSo 2026-04-06 17:15:36
34 跟貼 34
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
2294 跟貼 2294
釘釘發布DeepResearch多智能體框架，已在真實企業部署

機器之心Pro 2025-11-12 13:06:22
2 跟貼 2
“虧大了”？浙江多個小區物業主動撤場，業主卻稱：錢花得冤，背后有筆算不攏的賬

環球網資訊 2026-04-07 14:42:45
1 跟貼 1
毛新宇攜家人到楊開慧烈士陵園祭掃

政知新媒體 2026-04-05 08:48:13
2675 跟貼 2675
董宇輝爭議言論炸上熱搜，人設大反轉！

互聯網品牌官 2026-04-07 18:20:08
4 跟貼 4
國家繼續實施調控成品油價格適當調整

財聯社 2026-04-07 15:04:33
1125 跟貼 1125
趙心童創“三冠”新紀錄，英媒直呼：其統治力“令對手膽寒”

環球網資訊 2026-04-07 06:56:17
125 跟貼 125
廣州外賣騎手去年平均薪酬15萬，快遞員、貨車司機收入下降

南方都市報 2026-04-07 18:12:09
16 跟貼 16
鄭麗文率團抵達南京開始大陸參訪行程

央視新聞客戶端 2026-04-07 19:03:20
9 跟貼 9
把生命完全交給智能駕駛

搞笑龍眼 2026-04-07 03:08:06
52 跟貼 52
不止055！神秘水泥模型曝光，中國2萬噸巨艦要來了？

因果 2026-04-06 20:39:40
0 跟貼 0
北洋水師水兵墓前放中國航母模型。分析點評

致敬明天的太陽 2026-04-07 01:27:53
0 跟貼 0
網友清明上山偶遇野生菌，形狀奇特像小燈籠，網友：按照菌子邏輯，越好看越毒

重慶科教融媒體 2026-04-06 17:38:57
0 跟貼 0
廣州越秀白云或現嚴重回南天！近期全省雨霧頻繁空氣濕度偏高

南方都市報 2026-04-07 10:20:10
66 跟貼 66
這個時代必須以Agent為中心：三個趨勢回顧

量子位 2026-04-05 02:14:15
0 跟貼 0
美國眾議院民主黨議員推動彈劾防長赫格塞思

新京報 2026-04-07 12:30:07
57 跟貼 57
蔚來智能輔助駕駛實力破圈，用戶越用越上癮

車載娛樂 2026-04-06 12:06:25
4 跟貼 4
楊元慶，捐贈2億元！

證券時報 2026-04-06 22:44:23
882 跟貼 882
玄甲（AgentWard）全鏈路防御操作系統正式發布

機器之心Pro 2026-04-07 13:58:00
0 跟貼 0
綁匪改口「她已死」：1比特幣換尸體位置，FBI被罵傲慢

追星雷達站 2026-04-07 18:55:51
0 跟貼 0
免費無限用！谷歌上線了一款AI語音轉寫神器

智東西 2026-04-07 19:09:17
0 跟貼 0
智能快提車，撞車都識別不到！

皮特兒動漫 2026-04-06 16:07:03
1 跟貼 1
夏航季東航將采用國產大飛機C919執飛上海航線

黑龍江新聞網 2026-04-06 22:32:19
770 跟貼 770
用模型做出的水果可真好看

新知速報 2026-04-04 12:54:01
0 跟貼 0

手機 / 數碼

房產 / 家居

Anthropic工程師自曝：多智能體系統90%故障源于傳話游戲

結構化交接：別讓智能體寫小作文

顯式失敗：拒絕比猜測更安全

人工檢查點：鏈越長，人越要介入

狀態管理即編排

滿嘴謊言！OpenAI奧特曼黑料大起底

英媒：伊朗最高領袖病重昏迷 無法參與任何國家決策

英媒：伊朗最高領袖病重昏迷 無法參與任何國家決策

官宣簽約“AI球員”，這支球隊被罵慘了...

女首富陳麗華離世 被曝生前已分好遺產

10萬億財政轉移支付，被誰拿走了？

不止是大 極狐首款MPV問道V9靜態體驗

態度原創

干細胞抗衰4大誤區,90%的人都中招

猛料！又有世界500強級巨頭，低調買入海棠灣！

榮耀多款新品PC定檔，方飛透露WIN游戲本將成為三角洲聯賽指定本

大話西游手游通用套裝哪個好用？仙族首選容止，變身卡不再被克

英媒：伊朗最高領袖病重昏迷無法參與任何國家決策

英媒：伊朗最高領袖病重昏迷無法參與任何國家決策

女首富陳麗華離世被曝生前已分好遺產

不止是大極狐首款MPV問道V9靜態體驗