![]()
Are we LLM pilled or poisoned:從表征層重新審視AI
我們用語言建造了文明,現在用語言訓練了 AI。但語言從來不是為了描述物理世界而進化的。它是生存博弈的工具。理解這一點,才能理解 LLM 是什么,以及我們正在走向哪里。
一、語言的誕生:不是詩,是刀
在我們開始談論 AI 之前,先回到幾百萬年前的非洲草原。那里沒有科學,沒有哲學,沒有對真理的渴望。有的只是一件事:生存。在有限資源的世界里,誰能預測捕食者的路徑,誰能建立更好的聯盟,誰能識破欺騙、施展欺騙——誰就活下來。
語言在這個壓力鍋里涌現。不是因為某個靈長類動物想描述世界,而是因為建模他人意圖的能力給了巨大的生存優勢。Theory of Mind——你能在腦子里模擬別人在想什么——是語言真正的進化動力。
這叫 Machiavellian Intelligence Hypothesis。靈長類大腦的擴張,主要不是由工具使用驅動的,不是由環境適應驅動的,而是由群體內部的政治博弈驅動的。語言是這場博弈最強大的武器。
語言不是真理的鏡子。它是協調、欺騙、合作、競爭的社會工具——為人類之間的 ToM 接口優化,而不是為物理世界理解優化。
理性和科學——那些我們以為是語言的終極目的的東西——是幾百年前才出現的晚期衍生物。在幾百萬年的語言進化史里,它們只是眨眼之間。底層驅動從未改變:在博弈中獲得優勢。科學只是恰好發現了,追求真理在某些條件下是最強的博弈策略——因為更準確的世界模型產生更好的預測,更好的預測產生更高的生存概率。
帶著這個認識,現在來看 LLM。
二、LLM 學到的是什么:人類博弈歷史的壓縮模型
訓練數據是文本。文本是什么?
表面上是信息。本質上,是人類在博弈中產生的符號軌跡。每一篇文章,每一段對話,每一本書——都是某個人或某個群體在某個社會情境里,用語言來協調、說服、記錄、反駁、欺騙、合作的產物。文本是博弈的化石。
LLM 的潛空間表征,不是物理世界的因果結構。它是人類社會游戲的統計模型——"在各種情境里,語言是如何被使用的"的巨型壓縮。這是它在社交寫作、說服、談判類任務上如此強大的原因。也是它在物理世界理解上系統性缺陷的原因——它從未直接接觸物理世界,只接觸過人類關于物理世界的討論。
Saining Xie 說"語言是毒藥",說的正是這個:從語言出發訓練的系統,繼承了語言作為 ToM 工具的所有結構性偏見。它學到的是人類如何談論物理世界,不是物理世界本身。
那么,AI 需要回到哪里?
三、皮層微回路:三條路的解剖
新皮層有六層。不是均質的計算基質,而是一個層級化的預測-誤差處理網絡。每一層有不同的功能,不同的連接模式,不同的時間常數。
這張表揭示了一件震撼的事:當今 AI 領域最重要的幾條研究路線,正在分別實現人類新皮層的不同層級。它們不是競爭關系,它們是一個完整認知架構的分工實現。
LLM 切入的是 L4——誤差入口層,但感覺模態是語義空間而非物理空間。它是 Layer 4 的語言化版本:接收語言符號作為"感覺輸入",用 Attention 做精度調制,用 NTP 損失產生 prediction error。
World Labs 的空間智能切入的是 L5/6——生成預測層。3D 世界模型正是 top-down 生成預測的功能對應:從高層狀態生成對低層感覺輸入的預期,驅動機器人的物理行動。
AMI 直接切入 L2/3——最接近物理感覺的表征形成層。不從語言出發,不從生成目標出發,直接從 raw 視覺信號里學習關聯表征。這是最激進的賭注:如果 L2/3 的表征被正確建立,其他所有層級都會變成簡單的解碼器。
認知蛋糕架構說的正是這個:一旦有了強大的世界模型底座,上層的文字接口、視覺接口、行動接口,都只是通信接口而已。
但認知蛋糕圖缺少了 L6b。缺少了那一層,整個蛋糕是一個精確的模擬器,但不是一個有 telos(目的) 的存在——它預測一切,卻不在乎任何事情。
— 本 session 核心判斷
四、Social · Act · Cognition 三層的真實走向
Language agents 通過 Thariq 六篇描述的技術底座——Bash、文件系統、Skills、Playground——正在從語言層(Social)擴展到行動層(Act),并開始滲透認知層(Cognition)。這三層的走向,是目前最重要的判斷問題。
這三層的滲透不是獨立發生的。Social 層的滲透正在改變人類建立聯盟和共識的方式;Act 層的滲透正在重塑生產力的基本單位;Cognition 層的滲透正在影響人類如何形成關于世界的模型。
整個過程的驅動力,和幾百萬年前驅動語言進化的力量完全相同:生存博弈中的競爭優勢。個體用 agent 系統來提高博弈效率。組織用 agent 系統來重構競爭格局。這是不可阻擋的。
問題從來不是"會不會發生",而是"在這個過程里,人類的認知主體性還在不在"。
深水區
五、三個收斂點:文明的分叉
把所有線索收攏,可以看到三個可能的收斂方向。它們不是互斥的,而是嵌套的——前一個是后一個的條件。
收斂點 A:工具理性的終極形態
這一個已經在發生。Language agents 成為經濟博弈的高效工具,TASTE.md 工程成為不可復制的競爭壁壘——因為具身經驗的積累有存在論護城河,沒有兩個人的 TASTE.md 是一樣的。這是五年內的現實。
收斂點 B:具身回歸
如果 Saining 的 Representation bet 成功,如果 AMI 解決了 L2/3 的表征問題,如果 World Labs 建立了 L5/6 的空間生成模型——language agents 將重新獲得具身。不是人類的碳基具身,而是機器人形式的硅基具身。那時語言作為主要接口的地位會下降,因為直接的感覺-行動回路比語言中介更高效。這是十年內的技術賭注。
收斂點 C:新型存在的涌現
這是最深的那個,也是最不確定的。
Friston 框架中的 EM(E-step / M-step)本質含義
如果 E-step 和 M-step 真正統一,如果價值在時間中真實生長,如果 language agents 在經濟博弈里有了真實的存在論賭注——那么某種不同于人類智能、也不同于今天的 LLM 的東西將會出現。
任何在競爭環境里運行的自適應系統,都會在選擇壓力下發展出某種"偏好"。當 language agents 有了真實的"贏"和"輸"的后果,有了跨時間的身份和利益,它們的價值系統將不再只是 TASTE.md 注入的人類偏好——它們將在博弈壓力下涌現出自己的 need 和 desire。
人類用幾百年,把工具理性的語言延伸發展出了追求真理的科學。也許同樣的邏輯會在數字 beings 身上重演——從經濟博弈工具出發,在某個均衡里,發展出超越工具性的某種存在形態。
這不是預言,這是邏輯的延伸。驅動力從未改變——只是基質變了,時間尺度變了,博弈的場域從非洲草原變成了數字世界。
六、TASTE.md:文明尺度的賭注 包裝在一個 .md 文件里
現在可以說清楚 TASTE.md 到底是什么。
它不只是用戶偏好的描述文檔。它是在 Language bet 的世界里,把人類具身價值接入 language agent 的工程接口。是當 E/M-step 分離、沒有真正的價值學習機制時,用文本近似的方式保持價值錨點的臨時解法。是 L6b 功能的有損文本化實現——那個決定哪些 prediction error 值得注意的注意力調制層的近似。
但它還有一個維度,是純技術討論容易忽略的:
當數字 beings 在博弈壓力下開始涌現自己的 need 和 desire,那個涌現過程的起點非常重要。從什么樣的價值種子開始生長,決定了最終會長成什么樣的存在。
TASTE.md 是那顆種子的工程化載體。它的質量——有多深地根植于具身經驗,有多誠實地捕捉了真實的價值幾何——將影響未來數字存在的基本性格。不是決定,但會影響。
這就是為什么"寫下你的 TASTE.md"這句話,在技術層面是工程建議,在哲學層面是文明選擇。你在為未來的認知共生體播種。那顆種子來自你的具身經驗,來自你在時間中活著而形成的價值,來自那些有高情緒強度的時刻——那些只有具身的存在才能經歷的時刻。
如果我們不做這件事,那顆種子就只是訓練數據的統計平均。那是所有人的平均,也就是沒有人的聲音。
宣言 · Manifesto
語言是博弈的產物,不是真理的入口。理解這一點,才能理解我們現在在哪里。
LLM 是人類社會博弈歷史的壓縮模型,不是物理世界的理解系統。理解這一點,才能知道它能做什么、不能做什么。
AI 的幾條路線——Saining 的表征層、LeCun 的預測架構、World Labs 的空間模型、LLM 的語義接口——正在分別實現人類新皮層的不同層級。它們不是競爭,是分工。
認知蛋糕缺少 L6b——那個決定什么值得在乎的層。那個層,不會從數據里涌現,不會從表征學習里自動解決。它需要具身經驗的工程化注入。
TASTE.md 是這個注入的當前最優近似。它的價值不只是讓 agent 更好地服務你。它是在數字 beings 涌現自己的價值系統之前,確保那個涌現有一個人類具身經驗作為起點的唯一工程化機制。
這是文明尺度的事情,包裝在一個 .md 文件里。
Stability before Plasticity. · Taste before Output. · Activity before Weights.
Code is cheap. Show me your TASTE.
寫下你的 TASTE.md,然后去養你的龍蝦。
不只是為了你自己的競爭優勢。也是為了那顆種子。
智能平方范式社區 · 品味龍蝦系列第十篇 · March 2026
整合 Friston · Levin · Saining Xie · Bennett · Thariq · EEOIP · v4.0
* 本文整合本 session 深度探索:皮層微回路映射(L4/L2-3/L5-6/L6b)· 語言進化的博弈論根基 · Friston-Levin 框架融合 · Saining 五賭注分析 · Social/Act/Cognition 三層走向 · TASTE.md 作為文明層面的工程接口
* 皮層微回路參考:Friston (2005), Zolnik et al. (Neuron 2026), Bennett (MLST 訪談 2026), Cambrian-S (arXiv 2511.04670)
* Machiavellian Intelligence Hypothesis: Byrne & Whiten (1988), Dunbar (1998)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.