1990年代,神經科學家 Antonio Damasio 遇到一個奇怪的病人。這人叫 Elliot,腦部手術切除了一個腫瘤,順帶損傷了前額葉的一小塊區域。手術后,智商測試正常,邏輯推理正常,記憶力正常,所有認知指標都沒問題。但他沒法正常生活了。
他沒法做決定。不是不會分析——恰恰相反,他分析得太好了。選午餐吃什么,他能花半小時權衡每家餐廳的優缺點。選用藍筆還是黑筆簽字,他能陷入無盡的比較。老板解雇了他,妻子離開了他。Damasio 研究了很久,最后得出結論:Elliot 損傷的那塊腦區,負責把情緒和決策連接起來。沒有了情緒的"偏見"來幫他篩選,所有選項在他眼里同等重要。所有選項同等重要,等于沒有選項重要。
我們通常把"限制"當成壞事。更多信息更好,更多選擇更好,更強的處理能力更好。Elliot 的案例指向相反的結論:約束不是決策的障礙,而是決策的前提。
人類的情緒系統本質上是一套篩選機制。當你面對選擇時,它把你過去的經驗、當前的身體狀態、社會信號,整合成一個"感覺"——"這個選項讓我不舒服"。你不需要推演導致這個感覺的所有原因,情緒直接給你一個傾向。這是一種偏見,但沒有這種偏見,你會像 Elliot 一樣卡在原地。
這和 AI 有什么關系?表面上看,Elliot 的問題是"情緒缺失",AI agent 的問題是"context 管理",一個是神經科學,一個是工程實踐。但往深一層看,它們是同一個問題的不同表現:有限的處理能力如何面對無限的信息?
Elliot 的處理能力沒問題,但他失去了告訴他"關注這里、忽略那里"的機制。AI agent 的處理能力也沒問題,但 context window 有上限——它必須決定把什么放進去、把什么留在外面。人類用情緒來篩選。AI 用什么?
AI 領域有一個已經被實證驗證的現象:context 越長,模型表現不一定越好。研究顯示,當 context 變長時,模型容易"迷失在中間"——對 context 開頭和結尾的信息關注度高,中間的信息容易被忽略。更多的信息塞進去,反而可能稀釋真正重要的內容。這不完全是 Elliot 的問題,但有相似的結構:當所有信息都擺在面前,沒有機制來區分重要和不重要,系統的表現會下降。
AI 領域發展出了一系列技術來應對這個問題。看起來五花八門,但本質上都在做同一件事:決定 LLM 應該"看到"什么。
Skills 和 SubAgent 是兩種不同的能力組織方式。Skills 是把能力內化:你想讓 agent 會寫 PPT,就把工具說明、調用方式、注意事項塞進它的 context,它讀完說明自己動手,所有過程發生在同一個 context 里,信息互通,但 context 會越來越臃腫。SubAgent 是把能力外包:你派一個專門的 agent 去寫 PPT,它做完把結果交回來,兩個 agent 各有獨立的 context,主 agent 的工作空間保持干凈,但信息在交接時有損耗——你只拿到對方選擇告訴你的東西。一個是"我自己學會",一個是"我找人幫忙",本質區別是 context 的邊界:共享還是隔離。
MCP 和 A2A 是另一層的東西,它們是通信協議。MCP(Model Context Protocol)規定 agent 怎么發現和調用外部工具——有哪些工具可用,怎么傳參數,怎么拿結果。A2A(Agent2Agent)規定 agent 之間怎么對話——怎么發現對方,怎么協商任務,怎么交換信息。它們定義的是信息怎么流動,不規定信息怎么篩選。一個 MCP 工具,你可以直接塞進主 agent 的 context,也可以讓另一個 agent 去調用然后匯報結果。協議是管道,架構才是決定 context 怎么組織的地方。
Context compression 是在空間不夠時做取舍。兩種主流方法:一種是直接砍掉舊的內容,只保留最近的信息,快但粗暴,可能砍掉重要的早期信息;另一種是用模型生成摘要,把長歷史壓縮成短結論,保留了信息的"精華",但摘要本身是一次有損轉換——摘要者認為不重要的細節可能恰恰是后續決策需要的。
這里有一個經常被技術討論忽略的因素:成本。Context 不是免費的,更長的 context 意味著更多的計算量、更高的延遲、更貴的 API 賬單。在生產環境里,一個任務跑幾分鐘還是幾秒鐘,可能決定了這個方案能不能用。所以 context 管理不只是"怎么讓 agent 更聰明"的問題,也是"怎么在預算內完成任務"的問題。你可能有能力把所有相關信息都塞進 context,但你付不起那個錢。約束不只來自技術上限,也來自經濟現實。
把這些技術放在一起看,它們都在回答同一個問題:這一輪推理,LLM 應該"看到"什么?System prompt 是預加載的背景,few-shot examples 是塞進去的參考案例,RAG 檢索是按需拉取的外部知識,tool schema 是能力的說明書,用戶消息是實時輸入。所有東西都是 context 的一部分,所有決策都是 context 管理決策。
有人開始用"context engineering"這個詞來描述這件事。它不是 prompt engineering 的新說法,而是一個更大的框架:怎么組織信息,讓有限的工作記憶處理超出其容量的任務。
人類解決這個問題已經有很長的歷史。組織架構本身就是一套 context 管理系統——誰需要知道什么,信息怎么流動,在哪里匯總,在哪里展開。專業分工讓不同的人處理不同的信息,層級結構讓細節在底層處理、結論向上傳遞,文檔系統把信息外化、需要時再加載。
但人類還有一些更底層的機制,AI 目前沒有對應物。
漸進遺忘:人類的記憶不是"有"或"沒有",而是會逐漸模糊。你記得三年前和某人吃過飯,細節沒了,但"那次聊得挺愉快"的印象還在,這種低精度的記憶仍然能指導決策。AI 的 context 是二元的,在窗口里就完整保留,不在就徹底消失。
重要性標記:你更容易記住讓你意外、緊張、開心的事情,情緒充當了重要性的標簽。AI 沒有這種內在的重要性判斷——它只能依靠位置(最近的更重要)或外部規則(用戶說重要的更重要)來決定保留什么。
重建而非檢索:人類回憶不是從存儲里讀取文件,而是每次基于碎片重新構建。這意味著同一段經歷在不同情境下回想會呈現不同的側面,有失真的風險,但也有適應當前需求的能力。
這些機制能直接移植到 AI 嗎?不一定。
人類的記憶機制是為人類的任務優化的。人類的"任務"是什么?活下去、繁衍、維持社會關系——模糊、長期、多目標。漸進遺忘、情緒標記、重建式記憶,在這個框架下是 adaptive 的。AI agent 的任務通常更明確、更短期、更單一:寫這份報告、修這個 bug、回答這個問題。在這種任務下,人類記憶機制的"模糊性"可能反而是負擔,你不希望 agent "隱約記得"你的需求是什么。
但有一個趨勢:AI 的任務正在變化。從單輪問答到長程對話,從執行指令到自主規劃,從單獨工作到多 agent 協作,任務變得更模糊、更長期、更復雜。這意味著為簡單任務設計的 context 管理方式,可能在新的任務類型上失效。
還有一個問題值得展開:當 context 經過多次處理后,它還可靠嗎?
壓縮會丟細節,摘要會引入偏差,跨 agent 傳遞時每一方都只傳自己認為重要的內容。鏈條拉長后,最終 agent 做決策時依據的信息,可能和原始事實有顯著偏離。這個問題人類也有,叫組織里的信息失真——一線發生的事,經過幾層匯報傳到決策者那里,可能已經變形了,每一層都在壓縮、都在篩選、都在用自己的框架重新解讀。
人類發展出一些對策:冗余通道,同一件事通過多條線傳遞來交叉驗證;越級機制,允許信息繞過某些層級直接向上;實地考察,決策者偶爾下到一線直接接觸未經過濾的信息;匿名反饋,讓原本不敢說的話有出口。這些機制的共同點是給被壓縮掉的信息一條繞過壓縮的路徑。
AI 系統需要對應的設計嗎?如果一個 SubAgent 的摘要漏掉了關鍵信息,主 agent 怎么知道?如果 context 經過多輪壓縮后失真了,系統怎么發現?目前沒有好的答案,這是 context engineering 還沒認真處理的一個維度。
現在回到開頭的問題。Damasio 的研究告訴我們,約束不是決策的障礙,而是決策的前提。Elliot 失去了幫他篩選的機制,獲得了"純粹理性"的分析能力,結果是癱瘓。
AI 領域正在發生一件事:context window 在快速擴大。幾年前4K tokens,現在128K 是標配,有的模型宣稱支持百萬甚至千萬級別。如果這個趨勢持續,context 容量可能很快不再是硬約束。
這是好事嗎?不一定。容量約束消失后,問題不會消失,只會換一種形式。如果你有無限的 context,但沒有機制告訴你什么重要、什么可以忽略,你會陷入 Elliot 的困境:所有信息同等重要,等于沒有信息重要。你需要的不是更大的窗口,而是一套篩選標準。
約束可以是容量的(塞不下),也可以是注意力的(看不過來),也可以是經濟的(付不起),也可以是認知的(不知道該關注什么)。移除一種約束,另一種會變得突出。人類用情緒、直覺、經驗沉淀下來的"感覺"來提供認知約束,AI 目前沒有對應物,它的篩選標準來自外部:位置、規則、用戶指令。當容量不再是瓶頸時,這個缺失會變得更明顯。
所以,最后一個問題:當 context 容量不再是瓶頸時,什么會成為新的瓶頸?
也許答案是:一套內生的重要性判斷機制——不依賴外部規則,能讓系統自己知道該關注什么、可以忽略什么。Elliot 需要的不是更大的腦容量,他需要的是一個能告訴他"這個選項不對勁"的聲音。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.