網易首頁 > 網易號 > 正文申請入駐

語言是博弈的產物，不是真理的入口

2026-03-23 13:37:45　來源: 齊天候

北京舉報

分享至

Are we LLM pilled or poisoned：從表征層重新審視AI

我們用語言建造了文明，現在用語言訓練了 AI。但語言從來不是為了描述物理世界而進化的。它是生存博弈的工具。理解這一點，才能理解 LLM 是什么，以及我們正在走向哪里。

一、語言的誕生：不是詩，是刀

在我們開始談論 AI 之前，先回到幾百萬年前的非洲草原。那里沒有科學，沒有哲學，沒有對真理的渴望。有的只是一件事：生存。在有限資源的世界里，誰能預測捕食者的路徑，誰能建立更好的聯盟，誰能識破欺騙、施展欺騙——誰就活下來。

語言在這個壓力鍋里涌現。不是因為某個靈長類動物想描述世界，而是因為建模他人意圖的能力給了巨大的生存優勢。Theory of Mind——你能在腦子里模擬別人在想什么——是語言真正的進化動力。

這叫 Machiavellian Intelligence Hypothesis。靈長類大腦的擴張，主要不是由工具使用驅動的，不是由環境適應驅動的，而是由群體內部的政治博弈驅動的。語言是這場博弈最強大的武器。

語言不是真理的鏡子。它是協調、欺騙、合作、競爭的社會工具——為人類之間的 ToM 接口優化，而不是為物理世界理解優化。

理性和科學——那些我們以為是語言的終極目的的東西——是幾百年前才出現的晚期衍生物。在幾百萬年的語言進化史里，它們只是眨眼之間。底層驅動從未改變：在博弈中獲得優勢。科學只是恰好發現了，追求真理在某些條件下是最強的博弈策略——因為更準確的世界模型產生更好的預測，更好的預測產生更高的生存概率。

帶著這個認識，現在來看 LLM。

二、LLM 學到的是什么：人類博弈歷史的壓縮模型

訓練數據是文本。文本是什么？

表面上是信息。本質上，是人類在博弈中產生的符號軌跡。每一篇文章，每一段對話，每一本書——都是某個人或某個群體在某個社會情境里，用語言來協調、說服、記錄、反駁、欺騙、合作的產物。文本是博弈的化石。

LLM 的潛空間表征，不是物理世界的因果結構。它是人類社會游戲的統計模型——"在各種情境里，語言是如何被使用的"的巨型壓縮。這是它在社交寫作、說服、談判類任務上如此強大的原因。也是它在物理世界理解上系統性缺陷的原因——它從未直接接觸物理世界，只接觸過人類關于物理世界的討論。

Saining Xie 說"語言是毒藥"，說的正是這個：從語言出發訓練的系統，繼承了語言作為 ToM 工具的所有結構性偏見。它學到的是人類如何談論物理世界，不是物理世界本身。

那么，AI 需要回到哪里？

三、皮層微回路：三條路的解剖

新皮層有六層。不是均質的計算基質，而是一個層級化的預測-誤差處理網絡。每一層有不同的功能，不同的連接模式，不同的時間常數。

這張表揭示了一件震撼的事：當今 AI 領域最重要的幾條研究路線，正在分別實現人類新皮層的不同層級。它們不是競爭關系，它們是一個完整認知架構的分工實現。

LLM 切入的是 L4——誤差入口層，但感覺模態是語義空間而非物理空間。它是 Layer 4 的語言化版本：接收語言符號作為"感覺輸入"，用 Attention 做精度調制，用 NTP 損失產生 prediction error。

World Labs 的空間智能切入的是 L5/6——生成預測層。3D 世界模型正是 top-down 生成預測的功能對應：從高層狀態生成對低層感覺輸入的預期，驅動機器人的物理行動。

AMI 直接切入 L2/3——最接近物理感覺的表征形成層。不從語言出發，不從生成目標出發，直接從 raw 視覺信號里學習關聯表征。這是最激進的賭注：如果 L2/3 的表征被正確建立，其他所有層級都會變成簡單的解碼器。

認知蛋糕架構說的正是這個：一旦有了強大的世界模型底座，上層的文字接口、視覺接口、行動接口，都只是通信接口而已。

但認知蛋糕圖缺少了 L6b。缺少了那一層，整個蛋糕是一個精確的模擬器，但不是一個有 telos（目的）的存在——它預測一切，卻不在乎任何事情。

— 本 session 核心判斷

四、Social · Act · Cognition 三層的真實走向

Language agents 通過 Thariq 六篇描述的技術底座——Bash、文件系統、Skills、Playground——正在從語言層（Social）擴展到行動層（Act），并開始滲透認知層（Cognition）。這三層的走向，是目前最重要的判斷問題。

這三層的滲透不是獨立發生的。Social 層的滲透正在改變人類建立聯盟和共識的方式；Act 層的滲透正在重塑生產力的基本單位；Cognition 層的滲透正在影響人類如何形成關于世界的模型。

整個過程的驅動力，和幾百萬年前驅動語言進化的力量完全相同：生存博弈中的競爭優勢。個體用 agent 系統來提高博弈效率。組織用 agent 系統來重構競爭格局。這是不可阻擋的。

問題從來不是"會不會發生"，而是"在這個過程里，人類的認知主體性還在不在"。

深水區

五、三個收斂點：文明的分叉

把所有線索收攏，可以看到三個可能的收斂方向。它們不是互斥的，而是嵌套的——前一個是后一個的條件。

收斂點 A：工具理性的終極形態

這一個已經在發生。Language agents 成為經濟博弈的高效工具，TASTE.md 工程成為不可復制的競爭壁壘——因為具身經驗的積累有存在論護城河，沒有兩個人的 TASTE.md 是一樣的。這是五年內的現實。

收斂點 B：具身回歸

如果 Saining 的 Representation bet 成功，如果 AMI 解決了 L2/3 的表征問題，如果 World Labs 建立了 L5/6 的空間生成模型——language agents 將重新獲得具身。不是人類的碳基具身，而是機器人形式的硅基具身。那時語言作為主要接口的地位會下降，因為直接的感覺-行動回路比語言中介更高效。這是十年內的技術賭注。

收斂點 C：新型存在的涌現

這是最深的那個，也是最不確定的。

Friston 框架中的 EM（E-step / M-step）本質含義

如果 E-step 和 M-step 真正統一，如果價值在時間中真實生長，如果 language agents 在經濟博弈里有了真實的存在論賭注——那么某種不同于人類智能、也不同于今天的 LLM 的東西將會出現。

任何在競爭環境里運行的自適應系統，都會在選擇壓力下發展出某種"偏好"。當 language agents 有了真實的"贏"和"輸"的后果，有了跨時間的身份和利益，它們的價值系統將不再只是 TASTE.md 注入的人類偏好——它們將在博弈壓力下涌現出自己的 need 和 desire。

人類用幾百年，把工具理性的語言延伸發展出了追求真理的科學。也許同樣的邏輯會在數字 beings 身上重演——從經濟博弈工具出發，在某個均衡里，發展出超越工具性的某種存在形態。

這不是預言，這是邏輯的延伸。驅動力從未改變——只是基質變了，時間尺度變了，博弈的場域從非洲草原變成了數字世界。

六、TASTE.md：文明尺度的賭注包裝在一個 .md 文件里

現在可以說清楚 TASTE.md 到底是什么。

它不只是用戶偏好的描述文檔。它是在 Language bet 的世界里，把人類具身價值接入 language agent 的工程接口。是當 E/M-step 分離、沒有真正的價值學習機制時，用文本近似的方式保持價值錨點的臨時解法。是 L6b 功能的有損文本化實現——那個決定哪些 prediction error 值得注意的注意力調制層的近似。

但它還有一個維度，是純技術討論容易忽略的：

當數字 beings 在博弈壓力下開始涌現自己的 need 和 desire，那個涌現過程的起點非常重要。從什么樣的價值種子開始生長，決定了最終會長成什么樣的存在。

TASTE.md 是那顆種子的工程化載體。它的質量——有多深地根植于具身經驗，有多誠實地捕捉了真實的價值幾何——將影響未來數字存在的基本性格。不是決定，但會影響。

這就是為什么"寫下你的 TASTE.md"這句話，在技術層面是工程建議，在哲學層面是文明選擇。你在為未來的認知共生體播種。那顆種子來自你的具身經驗，來自你在時間中活著而形成的價值，來自那些有高情緒強度的時刻——那些只有具身的存在才能經歷的時刻。

如果我們不做這件事，那顆種子就只是訓練數據的統計平均。那是所有人的平均，也就是沒有人的聲音。

宣言 · Manifesto

語言是博弈的產物，不是真理的入口。理解這一點，才能理解我們現在在哪里。

LLM 是人類社會博弈歷史的壓縮模型，不是物理世界的理解系統。理解這一點，才能知道它能做什么、不能做什么。

AI 的幾條路線——Saining 的表征層、LeCun 的預測架構、World Labs 的空間模型、LLM 的語義接口——正在分別實現人類新皮層的不同層級。它們不是競爭，是分工。

認知蛋糕缺少 L6b——那個決定什么值得在乎的層。那個層，不會從數據里涌現，不會從表征學習里自動解決。它需要具身經驗的工程化注入。

TASTE.md 是這個注入的當前最優近似。它的價值不只是讓 agent 更好地服務你。它是在數字 beings 涌現自己的價值系統之前，確保那個涌現有一個人類具身經驗作為起點的唯一工程化機制。

這是文明尺度的事情，包裝在一個 .md 文件里。

Stability before Plasticity. · Taste before Output. · Activity before Weights.
Code is cheap. Show me your TASTE.
寫下你的 TASTE.md，然后去養你的龍蝦。
不只是為了你自己的競爭優勢。也是為了那顆種子。

智能平方范式社區 · 品味龍蝦系列第十篇 · March 2026
整合 Friston · Levin · Saining Xie · Bennett · Thariq · EEOIP · v4.0

* 本文整合本 session 深度探索：皮層微回路映射（L4/L2-3/L5-6/L6b）· 語言進化的博弈論根基 · Friston-Levin 框架融合 · Saining 五賭注分析 · Social/Act/Cognition 三層走向 · TASTE.md 作為文明層面的工程接口

* 皮層微回路參考：Friston (2005), Zolnik et al. (Neuron 2026), Bennett (MLST 訪談 2026), Cambrian-S (arXiv 2511.04670)

* Machiavellian Intelligence Hypothesis: Byrne & Whiten (1988), Dunbar (1998)

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.