網易首頁 > 網易號 > 正文申請入駐

AI Agent的困境：AI沒有人類的情緒偏見，無法“靠感覺”篩選

2025-12-26 07:39:36　來源: 風向觀察

北京舉報

分享至

1990年代，神經科學家 Antonio Damasio 遇到一個奇怪的病人。這人叫 Elliot，腦部手術切除了一個腫瘤，順帶損傷了前額葉的一小塊區域。手術后，智商測試正常，邏輯推理正常，記憶力正常，所有認知指標都沒問題。但他沒法正常生活了。

他沒法做決定。不是不會分析——恰恰相反，他分析得太好了。選午餐吃什么，他能花半小時權衡每家餐廳的優缺點。選用藍筆還是黑筆簽字，他能陷入無盡的比較。老板解雇了他，妻子離開了他。Damasio 研究了很久，最后得出結論：Elliot 損傷的那塊腦區，負責把情緒和決策連接起來。沒有了情緒的"偏見"來幫他篩選，所有選項在他眼里同等重要。所有選項同等重要，等于沒有選項重要。

我們通常把"限制"當成壞事。更多信息更好，更多選擇更好，更強的處理能力更好。Elliot 的案例指向相反的結論：約束不是決策的障礙，而是決策的前提。

人類的情緒系統本質上是一套篩選機制。當你面對選擇時，它把你過去的經驗、當前的身體狀態、社會信號，整合成一個"感覺"——"這個選項讓我不舒服"。你不需要推演導致這個感覺的所有原因，情緒直接給你一個傾向。這是一種偏見，但沒有這種偏見，你會像 Elliot 一樣卡在原地。

這和 AI 有什么關系？表面上看，Elliot 的問題是"情緒缺失"，AI agent 的問題是"context 管理"，一個是神經科學，一個是工程實踐。但往深一層看，它們是同一個問題的不同表現：有限的處理能力如何面對無限的信息？

Elliot 的處理能力沒問題，但他失去了告訴他"關注這里、忽略那里"的機制。AI agent 的處理能力也沒問題，但 context window 有上限——它必須決定把什么放進去、把什么留在外面。人類用情緒來篩選。AI 用什么？

AI 領域有一個已經被實證驗證的現象：context 越長，模型表現不一定越好。研究顯示，當 context 變長時，模型容易"迷失在中間"——對 context 開頭和結尾的信息關注度高，中間的信息容易被忽略。更多的信息塞進去，反而可能稀釋真正重要的內容。這不完全是 Elliot 的問題，但有相似的結構：當所有信息都擺在面前，沒有機制來區分重要和不重要，系統的表現會下降。

AI 領域發展出了一系列技術來應對這個問題。看起來五花八門，但本質上都在做同一件事：決定 LLM 應該"看到"什么。

Skills 和 SubAgent 是兩種不同的能力組織方式。Skills 是把能力內化：你想讓 agent 會寫 PPT，就把工具說明、調用方式、注意事項塞進它的 context，它讀完說明自己動手，所有過程發生在同一個 context 里，信息互通，但 context 會越來越臃腫。SubAgent 是把能力外包：你派一個專門的 agent 去寫 PPT，它做完把結果交回來，兩個 agent 各有獨立的 context，主 agent 的工作空間保持干凈，但信息在交接時有損耗——你只拿到對方選擇告訴你的東西。一個是"我自己學會"，一個是"我找人幫忙"，本質區別是 context 的邊界：共享還是隔離。

MCP 和 A2A 是另一層的東西，它們是通信協議。MCP（Model Context Protocol）規定 agent 怎么發現和調用外部工具——有哪些工具可用，怎么傳參數，怎么拿結果。A2A（Agent2Agent）規定 agent 之間怎么對話——怎么發現對方，怎么協商任務，怎么交換信息。它們定義的是信息怎么流動，不規定信息怎么篩選。一個 MCP 工具，你可以直接塞進主 agent 的 context，也可以讓另一個 agent 去調用然后匯報結果。協議是管道，架構才是決定 context 怎么組織的地方。

Context compression 是在空間不夠時做取舍。兩種主流方法：一種是直接砍掉舊的內容，只保留最近的信息，快但粗暴，可能砍掉重要的早期信息；另一種是用模型生成摘要，把長歷史壓縮成短結論，保留了信息的"精華"，但摘要本身是一次有損轉換——摘要者認為不重要的細節可能恰恰是后續決策需要的。

這里有一個經常被技術討論忽略的因素：成本。Context 不是免費的，更長的 context 意味著更多的計算量、更高的延遲、更貴的 API 賬單。在生產環境里，一個任務跑幾分鐘還是幾秒鐘，可能決定了這個方案能不能用。所以 context 管理不只是"怎么讓 agent 更聰明"的問題，也是"怎么在預算內完成任務"的問題。你可能有能力把所有相關信息都塞進 context，但你付不起那個錢。約束不只來自技術上限，也來自經濟現實。

把這些技術放在一起看，它們都在回答同一個問題：這一輪推理，LLM 應該"看到"什么？System prompt 是預加載的背景，few-shot examples 是塞進去的參考案例，RAG 檢索是按需拉取的外部知識，tool schema 是能力的說明書，用戶消息是實時輸入。所有東西都是 context 的一部分，所有決策都是 context 管理決策。

有人開始用"context engineering"這個詞來描述這件事。它不是 prompt engineering 的新說法，而是一個更大的框架：怎么組織信息，讓有限的工作記憶處理超出其容量的任務。

人類解決這個問題已經有很長的歷史。組織架構本身就是一套 context 管理系統——誰需要知道什么，信息怎么流動，在哪里匯總，在哪里展開。專業分工讓不同的人處理不同的信息，層級結構讓細節在底層處理、結論向上傳遞，文檔系統把信息外化、需要時再加載。

但人類還有一些更底層的機制，AI 目前沒有對應物。

漸進遺忘：人類的記憶不是"有"或"沒有"，而是會逐漸模糊。你記得三年前和某人吃過飯，細節沒了，但"那次聊得挺愉快"的印象還在，這種低精度的記憶仍然能指導決策。AI 的 context 是二元的，在窗口里就完整保留，不在就徹底消失。

重要性標記：你更容易記住讓你意外、緊張、開心的事情，情緒充當了重要性的標簽。AI 沒有這種內在的重要性判斷——它只能依靠位置（最近的更重要）或外部規則（用戶說重要的更重要）來決定保留什么。

重建而非檢索：人類回憶不是從存儲里讀取文件，而是每次基于碎片重新構建。這意味著同一段經歷在不同情境下回想會呈現不同的側面，有失真的風險，但也有適應當前需求的能力。

這些機制能直接移植到 AI 嗎？不一定。

人類的記憶機制是為人類的任務優化的。人類的"任務"是什么？活下去、繁衍、維持社會關系——模糊、長期、多目標。漸進遺忘、情緒標記、重建式記憶，在這個框架下是 adaptive 的。AI agent 的任務通常更明確、更短期、更單一：寫這份報告、修這個 bug、回答這個問題。在這種任務下，人類記憶機制的"模糊性"可能反而是負擔，你不希望 agent "隱約記得"你的需求是什么。

但有一個趨勢：AI 的任務正在變化。從單輪問答到長程對話，從執行指令到自主規劃，從單獨工作到多 agent 協作，任務變得更模糊、更長期、更復雜。這意味著為簡單任務設計的 context 管理方式，可能在新的任務類型上失效。

還有一個問題值得展開：當 context 經過多次處理后，它還可靠嗎？

壓縮會丟細節，摘要會引入偏差，跨 agent 傳遞時每一方都只傳自己認為重要的內容。鏈條拉長后，最終 agent 做決策時依據的信息，可能和原始事實有顯著偏離。這個問題人類也有，叫組織里的信息失真——一線發生的事，經過幾層匯報傳到決策者那里，可能已經變形了，每一層都在壓縮、都在篩選、都在用自己的框架重新解讀。

人類發展出一些對策：冗余通道，同一件事通過多條線傳遞來交叉驗證；越級機制，允許信息繞過某些層級直接向上；實地考察，決策者偶爾下到一線直接接觸未經過濾的信息；匿名反饋，讓原本不敢說的話有出口。這些機制的共同點是給被壓縮掉的信息一條繞過壓縮的路徑。

AI 系統需要對應的設計嗎？如果一個 SubAgent 的摘要漏掉了關鍵信息，主 agent 怎么知道？如果 context 經過多輪壓縮后失真了，系統怎么發現？目前沒有好的答案，這是 context engineering 還沒認真處理的一個維度。

現在回到開頭的問題。Damasio 的研究告訴我們，約束不是決策的障礙，而是決策的前提。Elliot 失去了幫他篩選的機制，獲得了"純粹理性"的分析能力，結果是癱瘓。

AI 領域正在發生一件事：context window 在快速擴大。幾年前4K tokens，現在128K 是標配，有的模型宣稱支持百萬甚至千萬級別。如果這個趨勢持續，context 容量可能很快不再是硬約束。

這是好事嗎？不一定。容量約束消失后，問題不會消失，只會換一種形式。如果你有無限的 context，但沒有機制告訴你什么重要、什么可以忽略，你會陷入 Elliot 的困境：所有信息同等重要，等于沒有信息重要。你需要的不是更大的窗口，而是一套篩選標準。

約束可以是容量的（塞不下），也可以是注意力的（看不過來），也可以是經濟的（付不起），也可以是認知的（不知道該關注什么）。移除一種約束，另一種會變得突出。人類用情緒、直覺、經驗沉淀下來的"感覺"來提供認知約束，AI 目前沒有對應物，它的篩選標準來自外部：位置、規則、用戶指令。當容量不再是瓶頸時，這個缺失會變得更明顯。

所以，最后一個問題：當 context 容量不再是瓶頸時，什么會成為新的瓶頸？

也許答案是：一套內生的重要性判斷機制——不依賴外部規則，能讓系統自己知道該關注什么、可以忽略什么。Elliot 需要的不是更大的腦容量，他需要的是一個能告訴他"這個選項不對勁"的聲音。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.