網易首頁 > 網易號 > 正文申請入駐

人類智能正在迎來第六次突破

2026-02-21 08:09:20　來源: 圖解金融

上海舉報

分享至

圖源：Unsplash / Steve Johnson

來源｜《智能簡史》

作者｜[美] 麥克斯·班尼特

● ● ●

去年，27歲的前OpenAI研究員姚順雨出任騰訊“CEO/總裁辦公室”首席AI科學家。在接受一檔訪談時，姚順雨向大家推薦了麥克斯·班尼特（Max Bennett）的《智能簡史》。并且分享了書中提到的一個科學問題，“為什么大多數動物都是左右兩側對稱，并且有一個像嘴一樣的食物入口，有一個像肛門一樣的食物出口？為什么氣體是同一個口，而食物和水是兩個口”？

這個問題表面上與智能無關，但在作者麥克斯·班尼特看來，它正是智能演化的起點。圍繞這一問題，作者用五次關鍵突破串聯起生物智能、人類智能乃至人工智能的發展脈絡。

第一次突破是轉向：兩側對稱的身體，讓導航變成了簡單地向左或者向右。外界刺激則被簡單劃分為有利和有害，最終匯總為單一的行動方向。多巴胺、血清素等神經調質讓這種價值狀態得以持續和調節，快樂、痛苦、滿足與壓力這些情緒，其實最早不過是服務于這一簡單的需求。

第二次突破是強化：脊椎動物能夠進行試錯學習。這種無模型強化學習，使動物能夠從缺失中學習，形成時間感、好奇、恐懼、興奮、失望與寬慰等一整套圍繞預期與結果展開的心理機制。

第三次突破是模擬：新皮質的出現，讓生物能夠做到在真正行動前先進行想象中的嘗試，從而實現規劃與反事實思考。

第四次突破是心智化：靈長類能夠在內部建構自己與他人的心理狀態模型，據此理解意圖、預測行為，并通過觀察學習。

第五次突破是語言：在能夠理解自己與他人心理狀態的基礎上，人類用命名和語法把這些心理內容固定為共享的符號，使思想不僅可以被理解，還可以被傳遞、累積和跨代擴展。

智能并非一蹴而就，而是一次次結構性突破的疊加。從轉向到強化，再到模擬、心智化和語言，每一步都在塑造理解世界和行動的方式。這本書提醒著身處大模型時代的我們——理解智能的去向，往往需要先看清它從何處出發。

理解人的智能，答案并不在當下

在漫長的人工智能發展之路上，我們一直很難判斷距離創造人類級智能還有多遠。在20世紀60年代，問題求解算法取得初步成功之后，人工智能先驅馬文·明斯基（Marvin Minsky）曾發表著名的預言：“3~8年內，我們將擁有一臺具有人類平均智力的機器。”

然而，這并沒有發生。在20世紀80年代專家系統取得成功后，《商業周刊》宣稱“人工智能來了”，但隨后進展卻停滯了。現在隨著大語言模型的進步，許多研究人員再次宣稱“游戲結束了”，因為我們“即將實現人類級人工智能”。

在這個過程中，隨著人工智能變得越來越聰明，我們越來越難以評估我們在實現這一目標方面的進展。

如果一個人工智能系統在某項任務上的表現超過人類，這是否意味著這個系統已經掌握了人類解決該任務的方式？計算器能夠比人類更快地處理數字，但它真的理解數學嗎？ChatGPT在律師職業資格考試中的成績比大多數律師都要好，但它真的理解法律嗎？我們如何區分這些差異，在什么情況下，這些差異是有意義的呢？

人工智能和人類智能之間的差異令人困惑不已。為什么人工智能可以在國際象棋比賽中擊敗地球上的任何人，但把碟子裝進洗碗機的能力卻比不上一個6歲的孩子？

我們難以回答這些問題，是因為我們還不了解我們正在試圖重新構造的東西。從本質上講，所有這些問題都不是關于人工智能的，而是關于人類智能的本質——它是如何工作的，它為什么這樣工作，它是如何形成的。

數千年來，科學家一直在研究大腦是如何工作的，雖然取得了一些進展，但仍然沒有令人滿意的答案。問題在于其復雜性，這使得通過逆向工程破解大腦的工作原理變得非常困難。如果我們想要利用逆向工程揭示大腦的工作原理，如果我們想要揭開人類智能的隱藏本質，或許人類大腦并不是大自然給出的最佳線索。

盡管最直觀的了解人類大腦的方式是觀察人類大腦本身，但反直覺的是，這可能應該是最后研究的地方。而最佳的起點可能在地殼深處布滿塵土的化石中，在藏匿于動物細胞內部的微觀基因中，以及在我們星球上眾多其他動物的大腦中。

換句話說，答案可能不在當下，而是在遠古的隱藏遺跡中。

當研究其他動物的大腦時，最令人震驚的是，它們的大腦與我們的大腦有著驚人的相似之處。除了大小，我們的大腦和黑猩猩的大腦幾乎沒有什么區別。我們的大腦和大鼠的大腦之間的差異也只是少數大腦結構的差異。魚類的大腦幾乎擁有與我們的大腦相同的全部結構。

動物界中大腦的相似性具有重要的意義，因為它們是線索，是關于智能的本質、關于我們自身和我們過去的線索。

盡管如今的大腦很復雜，但它們并非一直如此。在進化過程中，系統起初很簡單，隨著時間的推移才逐漸變得復雜。大腦最早出現在6億年前，當時擁有這個大腦的是一種大小如米粒的蠕蟲。這種蠕蟲是所有現代擁有大腦的動物的祖先。

經過數億年的進化調整，和對無數神經環路的細微調整，它的簡單大腦逐漸進化成現代多樣化的大腦。這種古老蠕蟲后代中的一個分支，最終演化出了我們的大腦。

每一個動物的大腦都是我們重構祖先大腦的一點線索。通過研究這些動物共有的智力成就以及它們不具備的能力，我們不僅可以開始重構我們祖先的大腦，還可以確定這些古老的大腦賦予了他們哪些智力。

物理學家理查德·費曼在他行將去世時曾在黑板上留下了這樣一句話：“我不能創造的東西，我就無法理解它。”我們需要一個新的關于大腦的進化故事，這個故事不僅要基于現代對大腦解剖結構與時俱進的理解，還要基于現代對智能本身的理解。

作為這個故事的初步概述，人類大腦的整個進化過程可以合理地概括為僅僅五次突破的集大成，從最初的大腦一直發展到人類大腦。

第一次突破

第一次突破是轉向：通過區分外界刺激的好壞，從而趨利避害地進行導航。大約6億年前，原本具有徑向對稱神經元的類珊瑚動物逐漸演化成兩側對稱動物。這種兩側對稱的身體結構將導航決策簡化為二元的轉向選擇，神經網絡被整合成第一個大腦，使具有相反效價的信號能夠被整合成單一的轉向決策。多巴胺和血清素等神經調質使持續的狀態能夠更有效地重新定位并局部搜索特定區域。聯想學習使這些古老蠕蟲能夠調整各種刺激的相對效價。在這個最早的大腦中出現了動物的早期情感模板：快樂、痛苦、滿足和壓力。

乍一看，動物界的多樣性似乎令人驚嘆。但如果你進一步思考，會很容易地得出這樣的結論：動物界的驚人之處在于其多樣性如此貧瘠。地球上幾乎所有動物都有相同的身體結構。它們都有一個前端，包括嘴巴、大腦和主要的感覺器官（如眼睛和耳朵），它們都有一個后端用于排泄廢物。

進化生物學家將具有這種身體結構的動物稱為“兩側對稱動物”。第一批動物被認為是徑向對稱的，然而，現今的大多數動物物種卻是兩側對稱的。

對珊瑚等采用等待食物策略的生物來說，徑向對稱的身體結構相當便利；但對采用主動尋找食物的捕食策略的生物來說，這卻非常糟糕。如果徑向對稱的生物需要移動，它們就需要有感覺機制來檢測所有方向的食物位置，并且需要有一種機制能夠向任意方向移動。

相比之下，兩側對稱的身體結構則讓移動變得簡單得多。它們不需要一個能夠朝任意方向移動的運動系統，只需要決定是向右還是向左調整。

兩側對稱動物是唯一擁有大腦的動物。這并不是巧合。第一個大腦和兩側對稱動物的身體共享了相同的初始進化目的：它們使動物能夠通過轉向進行導航。轉向便是第一次突破。

現代線蟲被認為自早期兩側對稱動物以來一直保持相對不變。這些生物為我們提供了了解我們線蟲祖先內部機制的窗口。

轉向的突破需要兩側對稱動物將世界分為要接近的事物（“好的事物”）和要避免的事物（“壞的事物”）。

線蟲頭部周圍有感覺神經元，其中一些對光有反應，一些對摸有反應，還有一些對特定的化學物質有反應。為了進行轉向，早期的兩側對稱動物需要對它們檢測到的每一種氣味、觸感或其他刺激做出選擇：我是接近這個東西，避開這個東西，還是忽略這個東西？

當動物將刺激物分為好的和壞的時，心理學家和神經科學家稱它們正在給刺激物賦予效價（valence）。效價并不涉及道德判斷，它是一種更為原始的概念：動物是否會對刺激物做出接近或避開的反應。

如果一組感覺神經元實際上是正效價神經元，那么線蟲認為好的事物（如食物的氣味）會直接激活它們。反之，如果一組感覺神經元實際上是負效價神經元，那么線蟲認為壞的事物（如高溫、捕食者的氣味、強光）會直接激活它們。

轉向至少需要四樣東西：用于轉彎的兩側對稱身體結構、用于檢測和將刺激歸類為好或壞的效價神經元、用于將輸入整合為單個轉向決策的大腦，以及根據內部狀態調節效價的能力。但即便如此，進化仍在不斷進行微調。在早期的兩側對稱動物大腦中出現了另一種技巧，這種技巧進一步提高了轉向的有效性。這就是我們現在所說的情感的維形。

線蟲的腦部通過使用被稱為“神經調質”的化學物質來產生這些情感狀態，其中最著名的兩種神經調質是多巴胺和血清素。許多精神疾病，包括抑郁癥、強迫癥、焦慮癥、創傷后應激障礙和精神分裂癥等，都被認為至少部分是由神經調質失衡引起的。

線蟲簡單的大腦為我們提供了了解多巴胺和血清素最早或至少是非常早期功能的窗口。當線蟲檢測到周圍有食物時，就會釋放多巴胺；而當食物被檢測到在蟲體內部時，線蟲會釋放血清素。

盡管這些情感狀態在兩側對稱動物中普遍存在，但我們那些更遠房的動物親戚，如海葵、珊瑚和水母，并不表現出這樣的狀態，其中許多動物甚至根本沒有血清素神經元。

這使我們面臨一個令人驚訝的假設：情感，盡管在現代有著豐富的色彩，但它在5.5億年前在早期兩側對稱動物中進化出來，其初衷不過是轉向而已。

情感的基本模板似乎源于轉向的兩個基本問題。第一個問題是喚醒問題：我是否愿意消耗能量來移動？第二個問題是效價問題：我是愿意待在這個地方，還是離開這個地方？釋放特定的神經調質會強制針對每個問題給出特定的答案。

第二次突破

第二次突破是強化學習：通過學習來重復歷史上帶來正面價值的行為，并抑制帶來負面價值的行為。在人工智能領域，這可以被視為無模型強化學習的突破。大約5億年前，一個古老的兩側對稱動物的分支逐漸進化出了脊椎、眼睛、鰓和心臟，成為最早的脊椎動物，它們與現代魚類最為相似。它們的大腦也逐漸形成了所有現代脊椎動物大腦的原型：大腦皮質負責識別模式和構建空間地圖，基底神經節則進行試錯學習。這兩個結構都建立在下丘腦中更古老的效價機制遺跡之上。這種無模型強化學習帶來了一系列熟悉的智力和情感特征：從缺失中學習、時間感知、好奇心、恐懼、興奮、失望和寬慰。

寒武紀大爆發的高溫造就了脊椎動物的大腦模板，這一模板至今仍被這些早期魚類生物的所有后代共享。

魚類利用試錯方法學習任意動作序列的能力，已被多次發現。魚可以學會找到并按下特定按鈕來獲取食物，可以學會游過一個小逃生口來避免被網抓住，甚至可以學會躍過鐵環來獲取食物。魚在被訓練后幾個月甚至幾年內都能記住如何完成這些任務。

試錯學習通常有另一個名字：強化學習。只有當科學家試圖讓人工智能系統通過強化學習時，他們才意識到這并不簡單。通過直接強化正面結果和懲罰負面結果來訓練算法，是行不通的。

假設我們教人工智能下跳棋。在跳棋比賽中，強化和懲罰（輸贏結果）只會在游戲結束時發生，而一局游戲可能包含數百步棋。如果你贏了，哪一步棋應該被認為是好的？如果你輸了，哪一步棋應該被認為是壞的？如果沒有合理的跨時間分配貢獻度的策略，強化學習將不起作用，這被稱為“時序貢獻度分配問題”。

1984年，一個名叫理查德·薩頓（RichardSutton）的學生提交了他的博士論文。薩頓有一種預感：期望是之前強化學習嘗試中缺失的關鍵要素。

薩頓提出了一個簡單但激進的想法：與其使用實際的獎勵來強化行為，不如使用預期的獎勵來強化行為？換句話說，在人工智能系統認為自已快要贏的時候給予獎勵，而不是在它實際贏了之后才給予獎勵，又會怎樣呢？

薩頓將強化學習分解為兩個獨立的組成部分：“行動者”（actor）和“評判者”（critic）。評判者在游戲過程中的每一刻都預測獲勝的可能性：它預測哪些棋盤布局是好的，哪些是壞的。而行動者則負責選擇采取什么行動，并且不是在游戲結束時獲得獎勵，而是在評判者認為行動者的行動增加了獲勝可能性時獲得獎勵。行動者所學習的信號并不是獎勵本身，而是從某一時刻到下一時刻預測獎勵的時序差異。因此，薩頓將自己的方法命名為“時序差分學習”。

想象一下你正在下跳棋。在前9步中，你和對手一直勢均力敵。然后在第10步時，你采取了一些巧妙的策略，扭轉了游戲的局面。突然之間，你意識到自己比對手占據了更有利的位置。就是在這一刻，時序差分學習信號強化了你的棋步。

時序差分學習是否只是一種碰巧有效的巧妙技術，還是它捕捉到了智能本質中具體的基本要素？雖然薩頓希望他的想法與大腦之間存在聯系，卻是他的一名同事彼得·達揚（PeterDayan）證明了這一點。

任何試圖理解強化學習如何在脊椎動物大腦中工作的嘗試，都始于我們已經知道的一種神經調質：多巴胺。

一位名叫沃爾夫拉姆·舒爾茨（WolframSchultz）的科學家，曾設計了一個簡單的實驗來探究多巴胺與強化之間的關系。舒爾茨向猴子展示不同的提示（如幾何形狀的圖片），幾秒鐘后喂它們一些糖水。

當猴子看到一張它們知道會帶來糖水的圖片時，它們的多巴胺神經元會興奮起來，但是當這些猴子稍后得到糖水時，它們的多巴胺神經元并沒有偏離其基線活動水平。多巴胺神經元停止了對獎賞本身的反應，而只對預測線索做出反應。

在他的一只猴子學會了在看到特定圖片后期待糖水以后，舒爾茨再次展示了這張預示獎勵的圖片，卻沒有給猴子糖水。在這種情況下，盡管驚訝程度相同，但多巴胺活動卻急劇下降。

為什么多巴胺的活動會從獎勵本身轉移到獎勵的預測線索上？為什么當預期的獎勵缺失時，多巴胺的活動會減少？多年來，神經科學界一直不知道如何解讀舒爾茨的數據。

10年后，達揚和蒙塔古開始查閱文獻，尋找大腦是否利用了某種形式的時序差分學習的線索。當他們最終看到舒爾茨的數據時，他們立刻明白了他們所看到的意味著什么。

舒爾茨在猴子身上發現的多巴胺反應與薩頓的時序差分學習信號完全吻合。舒爾茨的猴子的多巴胺神經元因預測線索而興奮，因為這些線索意味著預測的未來獎勵增加（正時序差分）；當預期的獎勵到來時，多巴胺神經元并沒有受到影響，因為預測的未來獎勵沒有發生變化（沒有時序差分）；而當預期的獎勵缺失時，多巴胺神經元的活動減少，因為預測的未來獎勵減少（負時序差分）。

甚至，多巴胺對概率的反應方式也與時序差分學習信號一致：可能獲得食物的線索更能引起多巴胺的分泌。

魚類和哺乳動物大腦中的多巴胺系統神經環路基本相同，并且在魚類、大鼠、猴子和人類的大腦結構中，也發現了時序差分學習的信號。相反，在線蟲或其他簡單的兩側對稱動物的多巴胺神經元中，未發現時序差分學習的信號。

在早期的兩側對稱動物中，多巴胺是“好事將近”的信號，是一種原始的渴望。然而，在向脊椎動物過渡的過程中，這種“好事將近”的信號，轉變為“10秒鐘后恰好有35%的機會發生天大的好事”的信號。它從一個關于最近檢測到的食物的模糊平均值，轉變為一個不斷波動的、精確測量的和嚴格計算的預測未來獎勵的信號。

早期脊椎動物中的強化學習之所以可能，是因為早期兩側對稱動物已經進化出了效價和關聯性學習的機制。強化學習基于更簡單的好壞效價信號。從概念上講，脊椎動物的大腦是建立在更古老的兩側對稱動物轉向系統之上的。如果沒有轉向，就沒有試錯的起點，也就沒有衡量應該強化或減弱什么的基礎。

脊椎動物的試錯，又使得隨后更加復雜和重大的突破成為可能。早期的哺乳動物首先發現了如何以不同方式進行試錯學習：不是通過實踐，而是通過想象。

第三次突破

第三次突破是模擬：在精神上模擬刺激和行為。大約1億年前，在我們大約4英寸長的哺乳動物祖先中，我們脊椎動物祖先的皮質亞區域逐漸演變成了現代的新皮質。這種新皮質使動物能夠在內部模擬現實，進而使它們能夠在實際行動之前，通過想象向基底神經節展示應該做什么——這就是通過想象來學習。這些動物逐漸發展出了規劃的能力，這使得這些小型哺乳動物能夠重新演繹過去的事件（即情景記憶）并思考過去事件的不同可能性（即反事實學習）。運動皮質的后續進化使動物不僅能夠規劃整體導航路線，還能規劃具體的身體動作，從而賦予這些哺乳動物獨特而高效的精細運動技能。

在恐龍統治地球的1億年里，小型哺乳動物在世界的各個角落中艱難求生，并掌握了一項生存技巧一—進化出了一種新的認知能力，這是自寒武紀魚類以來最大的神經系統創新：大腦皮質的一個區域經過目前尚不清楚的一系列變化，轉變為一個名為“新皮質”（neocortex）的新區域。

新皮質賦予了這只“小鼠”一種超能力——在動作發生之前進行模擬的能力。如果說通過強化學習，早期脊椎動物獲得了通過實踐學習的能力，那么早期哺乳動物則獲得了更加令人印象深刻的能力一在行動前學習，即通過想象來學習。

新皮質的出現是人類智能進化史上的一個分水嶺。

我們人類過于重視語言和符號作為智能的基礎。靈長類動物、狗、貓、烏鴉、鸚鵡、章魚以及許多其他動物，并沒有類似人類的語言，但它們卻表現出了超越我們最先進人工智能系統的智能行為。它們所具有的是學習強大“世界模型”的能力，這些模型使它們能夠預測自己行為的后果，并尋找路徑和規劃行動以實現目標。學習這種世界模型的能力正是當今人工智能系統所缺少的。

哺乳動物新皮質（也許還有鳥類甚至章魚類似結構中的新皮質）所呈現的模擬正是這種缺失的“世界模型”。新皮質之所以如此強大，不僅是因為它可以將內部模擬與感覺證據相匹配（亥姆霍茲的通過推斷進行感知），更重要的是，這種模擬可以獨立地進行探索。

如果你有一個足夠豐富的外部世界內部模型，你就可以在腦海中探索這個世界，并預測你從未采取過的行動的后果。是的，你的新皮質讓你睜開眼睛認出你面前的椅子，但它也讓你閉上眼睛，在腦海中依然能看到那把椅子。你可以在腦海中旋轉和修改椅子，改變它的顏色與材質。當新皮質中的模擬與你周圍的真實外部世界脫節時一當它想象出一些不存在的東西時——它的強大之處就變得最為明顯。

這是新皮質賦予早期哺乳動物的禮物。正是想象力一呈現未來可能性和重溫過去事件的能力一一成為人類智能進化中的第三次突破。

從這種能力中涌現出了許多我們熟悉的智能特征，其中一些我們已經在人工智能系統中重新創造并超越了，而另一些仍然不在我們的掌握中。但所有這些特征都源自第一批哺乳動物微小的大腦。

擁有新皮質的早期哺乳動物，不僅學會了預測反射的激活或未來的獎勵，還學會了預測一切。

20世紀30年代，在加州大學伯克利分校工作的心理學家愛德華·托爾曼（EdwardTolman）注意到了一些奇怪的現象。當大鼠來到迷宮中的岔路口，面臨模糊的方向選擇時，它們會停下來，左右張望幾秒鐘，然后再選擇方向。

托爾曼提出了一個推測：大鼠在選擇之前會“預演”每一個選項。托爾曼把這種現象稱為“替代性試錯”。

通過實踐來學習的舊策略存在的另一個問題是，有時過去的獎勵并不能預測當前的獎勵。例如，把一只大鼠放在一個迷宮中，一側提供過咸的食物，另一側提供正常食物。讓大鼠正常地在迷宮中導航，并嘗試咸的食物（它會討厭并回避）和正常食物（大鼠會喜歡）。

假設你再次把大鼠置于那種情況，但有一點不同：你讓它嚴重缺鹽。大鼠會怎么做呢？

它會立刻奔向鹽。這讓人膛目結舌，因為現在大鼠正跑向迷宮中之前被負面強化過的區域。這之所以可能，是因為大鼠“模擬”了每條路徑，并通過替代性試錯意識到過咸的食物現在具備的吸引力。換句話說，在大鼠采取行動之前，通往鹽的這條路徑就已經通過替代性試錯得到了強化。我沒聽說過有任何研究表明魚類或爬行動物能夠完成這樣的任務。

第四次突破

第四次突破是心智化：建立自己的思維模型。大約在1000萬至3000萬年前，早期靈長類動物的新皮質中進化出了新區域，建立了對舊哺乳動物新皮質區域的模型。這意味著這些靈長類動物不僅能夠模擬行為和刺激（像早期的哺乳動物一樣），還能夠模擬自己具有不同意圖和認知的心理狀態。這些靈長類動物隨后能夠利用這一模型來預測自己的未來需求，理解他人的意圖和認知（即心智理論），并通過觀察來學習技能。

許多哺乳動物譜系的腦容量（按比例）并沒有比早期哺乳動物的大多少，只有某些哺乳動物譜系，如大象、海豚和靈長類動物的腦容量才顯著增大。

事實上，“為什么靈長類動物擁有如此大的大腦（特別是如此大的新皮質）？”這個問題自達爾文時代以來就一直困擾著科學家。早期靈長類動物的生活方式中究竟有什么需要如此大的大腦呢？

在20世紀80年代和90年代，包括尼古拉斯·漢弗萊（Nicho-lasHumphrey）、弗蘭斯·德·瓦爾（FransdeWaal）和羅賓·鄧巴（RobinDunbar）在內的眾多靈長類動物學家和進化心理學家開始推測，靈長類動物大腦的增大并不是1000萬到3000萬年前作為非洲叢林中的猴子所面臨的生態需求的結果，而是獨特的社會需求的結果。

羅賓·鄧巴的發現震驚了整個領域。這種相關性已在許多靈長類動物中得到證實：靈長類動物的大腦新皮質越大，其社會群體就越大。有趣的是，這一相關性并不適用于大多數其他動物。總的來說，并不是群體規模，而是早期靈長類動物所創造的特定類型的群體，似乎需要更大的大腦。

隨著研究人員對猴子和猿類行為的深入觀察，他們發現，早期靈長類動物的社交性發生了某種不同于早期哺乳動物的變化。

早期靈長類動物似乎有一種獨特的飲食習慣，直接在樹梢上覓食水果一一它們是食果動物。它們在果實成熟后、落到森林地面之前直接從樹上采摘。這使得靈長類動物能夠輕松獲取食物，同時避免與其他物種發生太多競爭。

這個獨特的生態位可能為早期靈長類動物帶來了兩大優勢，為它們擁有超大的大腦和復雜的社會群體奠定了基礎。其一，輕松獲取水果為早期靈長類動物提供了充足的熱量，使它們有了將能量用于發展更大的大腦的進化選擇。其二，也許更重要的是，它們獲得了大量的時間。

在動物界中，空閑時間是極為罕見的。但這些食果靈長類動物不必像其他動物那樣花費大量時間覓食，因此，當它們試圖攀登社會等級階梯時，這些靈長類動物擁有了一個新的進化選擇：它們不必將能量花費在進化出更強健的肌肉上以打斗的方式登頂，而是可以將能量用于進化出更大的大腦，通過政治手段登上頂端。

靈長類動物似乎把空閑時間都用來搞政治活動了。現代靈長類動物每天花費多達20%的時間進行社交，這比大多數其他哺乳動物花費的時間要多得多。研究表明，這種社交時間與靈長類動物擁有的空閑時間存在因果關系：隨著空閑時間的增加（通過更便捷地獲取食物），靈長類動物會花費更多時間進行社交。

這催生了一場全新的進化軍備競賽：一場政治智慧的較量。

任何天生就擅長取悅他人和結交盟友的靈長類動物都會生存得更好，并繁衍出更多的后代。這給其他靈長類動物施加了更大的壓力，迫使它們進化出更聰明的政治手段。事實上，靈長類動物的大腦新皮質大小不僅與社會群體規模有關，還與社交技巧有關。

這場軍備競賽的結果似乎促進了人類許多社會本能的蓬勃發展，既有好的一面（友誼、互惠、和解、信任、分享），也有壞的一面（部落主義、裙帶關系、欺騙）。盡管這些行為變化的許多方面并不需要特別聰明的新大腦系統，但在這場政治較量背后確實有一項智力成就：運用心智理論的能力。

如果一個物種沒有任何一種基本且原始的心智理論，那么其政治智慧就不可能實現一—只有具備這種能力，個體才能推斷出他人的需求，從而決定應該與誰親近以及如何親近。只有通過心智理論，個體靈長類動物才知道不應該去招惹那些雖然自身等級低但擁有高等級朋友的個體，這需要理解高等級個體的意圖以及他們在未來情境中可能的行為。只有具備運用心智理論的能力，你才能判斷出誰在未來可能變得強大，你需要與誰交朋友，以及你可以欺騙誰。

因此，這可能是靈長類動物開始擁有如此大的大腦的原因，為什么它們的大腦大小與社會群體規模相關，以及為什么靈長類動物進化出了推理他人思維的能力。

第五次突破，以及即將到來的第六次

第五次突破，關乎語言。

早期人類陷入了一場不太可能發生的“連鎖反應”。非洲草原上日漸消亡的森林將早期人類推向了一個制造工具、以肉為食的生態位，這個生態位需要準確地將使用工具的技能代代傳承下去。

原始語言開始出現，令使用和制造工具的技能能夠成功地跨代傳播。使語言得以產生的神經變化并不是一種新的神經結構，而是對更古老結構的調整，這種調整創造了一個語言學習程序。這個程序包括原始對話和共享注意力，使兒童能夠將名稱與其內部模擬的組成部分聯系起來。通過這一課程訓練，新皮質較老的區域被重新用于語言。

從這時起，人類開始嘗試與毫不相關的人一起使用這種原始語言，由此形成了一個由八卦、利他主義和懲罰措施組成的反饋循環，不斷促使人們發展更復雜的語言技能。隨著社會群體的擴大，思想開始在人們之間傳播，人類的集體智慧逐漸形成，為思想在不同代際間傳播和積累創造了一個短暫而靈活的媒介。

這要求人類擁有更大的大腦來儲存和分享更多的知識積累。也許正是出于這個原因（或者它促成了這一變化），人類發明了烹飪，提供了巨大的熱量盈余，使得大腦的體積能夠擴大到原來的3倍。

因此，在這場連鎖反應中，人類大腦進化歷程中的第五次也是最后一次重大突破——語言，應運而生。伴隨語言的產生，人類擁有了眾多特質，從無私到無情。如果說什么真正讓人類獨一無二，那就是人類的思想不再孤立存在，而是通過漫長歷史中積累的思想與他人緊密相連。

迄今為止，人類的歷史可以分為兩大篇章。第一篇是進化的篇章，講述現代人類如何從宇宙中的原始無生命物質中演化而來。第二篇是文化的篇章，描述大約10萬年前，社會性的現代人類如何從生物學上大體相同但文化上尚處于蒙昧狀態的祖先中逐步崛起、發展。

如果將我們宇宙千萬億年的歷程壓縮成一年，那么我們會發現，今天的我們正處于這一年的第7分鐘，甚至還沒有迎來第一天的黎明。我們仍然立于山腳之下，只是邁出了通向某處的漫長階梯上的第五步而已。

當然，我們不知道第六次突破會是什么，但它似乎越來越有可能是超級智能的出現——我們后代在硅基中的出現，實現智能載體從生物媒介到數字媒介的轉變。在這個新的媒介中，單一智能的認知能力將實現天文級的擴展。人類大腦的認知能力受到神經元處理速度、人體熱量以及大腦能在碳基生命形式中達到的最大尺寸等因素的嚴重限制。

第六次突破將是智能擺脫這些生物限制的時刻。基于硅的人工智能可以根據需要無限擴大其處理能力。實際上，隨著人工智能能夠自由復制和重新配置自身，個體性將失去其明確的界限。隨著生物交配機制被新的基于硅的機器訓練和構建新智能實體的機制所取代，親子關系也將獲得新的意義。

智能將不再被遺傳變異和自然選擇的緩慢過程所束縛，而是由更基本的進化原則，即最純粹的變異和選擇原則所驅動——當人工智能重構自身時，那些選擇支持更佳生存特征的人工智能當然會存活下來。

我們站在人類智能發展史上第六次突破的懸崖邊上，即將掌控生命起源的過程，并孕育出超級智能的人工生命體。

當我們展望這個新時代時，我們有必要回首那段長達10億年的漫長歷程，探尋我們大腦誕生的奧秘。隨著我們逐漸獲得如神一般的創造能力，我們也應從“無意識的進化過程”這位前輩那里汲取智慧。我們越深入理解自己的心智，就越能夠按照我們的形象創造出人工心智。同時，對心智形成過程的理解越透徹，我們就越能夠明智地選擇哪些智能特征需要摒棄，哪些需要保留，哪些有待改進。

我們是這一偉大轉變的中堅力量，這一轉變歷經140億年的漫長歲月。無論我們是否愿意，宇宙已將接力棒交到了我們手中。

結論：第六次突破

大約在10萬年前，隨著現代人類大腦的出現，人類長達40億年的進化故事終于畫上了句號。回首過去，我們可以開始描繪一幅圖景或一個框架，來展現人類大腦和智能的形成過程。我們可以將這些故事整合到我們前五次突破的框架中。

第一次突破是轉向：通過區分外界刺激的好壞，從而趨利避害地進行導航。大約6億年前，原本具有徑向對稱神經元的類珊瑚動物逐漸演化成兩側對稱動物。這種兩側對稱的身體結構將導航決策簡化為二元的轉向選擇，神經網絡被整合成第一個大腦，使具有相反效價的信號能夠被整合成單一的轉向決策。多巴胺和血清素等神經調質使持續的狀態能夠更有效地重新定位并局部搜索特定區域。聯想學習使這些古老蠕蟲能夠調整各種刺激的相對效價。在這個最早的大腦中出現了動物的早期情感模板：快樂、痛苦、滿足和壓力。

第二次突破是強化：通過學習來重復歷史上帶來正面價值的行為，并抑制帶來負面價值的行為。在人工智能領域，這可以被視為無模型強化學習的突破。大約5億年前，一個古老的兩側對稱動物的分支逐漸進化出了脊椎、眼睛、鰓和心臟，成為最早的脊椎動物，它們與現代魚類最為相似。它們的大腦也逐漸形成了所有現代脊椎動物大腦的原型：大腦皮質負責識別模式和構建空間地圖，基底神經節則進行試錯學習。這兩個結構都建立在下丘腦中更古老的效價機制遺跡之上。這種無模型強化學習帶來了一系列熟悉的智力和情感特征：從缺失中學習、時間感知、好奇心、恐懼、興奮、失望和寬慰。

第三次突破是模擬：在精神上模擬刺激和行為。大約1億年前，在我們大約4英寸長的哺乳動物祖先中，我們脊椎動物祖先的皮質亞區域逐漸演變成了現代的新皮質。這種新皮質使動物能夠在內部模擬現實，進而使它們能夠在實際行動之前，通過想象向基底神經節展示應該做什么——這就是通過想象來學習。

這些動物逐漸發展出了規劃的能力，這使得這些小型哺乳動物能夠重新演繹過去的事件（即情景記憶）并思考過去事件的不同可能性（即反事實學習）。運動皮質的后續進化使動物不僅能夠規劃整體導航路線，還能規劃具體的身體動作，從而賦予這些哺乳動物獨特而高效的精細運動技能。

第四次突破是心智化：建立自己的思維模型。大約在1000萬至3000萬年前，早期靈長類動物的新皮質中進化出了新區域，建立了對舊哺乳動物新皮質區域的模型。這意味著這些靈長類動物不僅能夠模擬行為和刺激（像早期的哺乳動物一樣），還能夠模擬自己具有不同意圖和認知的心理狀態。這些靈長類動物隨后能夠利用這一模型來預測自己的未來需求，理解他人的意圖和認知（即心智理論），并通過觀察來學習技能。

第五次突破是語言：通過命名和語法，語言將我們的內部模擬聯系在一起，使得思想能夠跨代積累。

點個在看支持一下??

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.