![]()
導語
解釋語言的起源是理解人類作為一個物種的關鍵挑戰。長期以來,缺乏化石記錄和對動物交流的未知讓這一問題顯得難以攻克 。過去的研究往往試圖尋找某種單一的“銀彈”——例如一個特定的基因突變——來解釋人類語言的獨特性,但現代生物學證據表明這種觀點已站不住腳。在這里,作者團隊提出了一個實證性的“生物文化框架(Biocultural Framework)”,利用跨學科的協同作用來推動語言演化的研究。該方法是多層面的,將語言的出現視為多種能力(如:vocal learning, structure, sociality)趨同的結果,每種能力都有其獨特的演化軌跡。這一框架明確了生物準備(Biological Preparedness)與文化傳播(Cultural Transmission)及其相互作用的重要性。文中通過三個案例研究——發聲學習、語言結構和社會基礎——展示了如何通過整合基因組學、實驗心理學、動物行為學和計算模型的最新發現,為未來的研究設定新的議程。
關鍵詞:語言演化 (Language Evolution),生物文化框架 (Biocultural Framework),發聲學習 (Vocal Production Learning),文化傳播 (Cultural Transmission),基因-文化共演化 (Gene-Culture Coevolution)
任筱芃丨作者
趙思怡丨審校
![]()
論文題目:What enables human language? A biocultural framework 論文鏈接:https://doi.org/10.1126/science.adq8303 發表時間:2025年11月20日 論文來源:Science
告別“單一奇跡”:語言演化的新范式
在《刺客信條》的設定里,擁有三螺旋 DNA 的“伊述人”具備凡人無法企及的感知與控制力。而在現實的科學探索中,人類長期以來也陷入了類似的迷思——試圖尋找某種單一的基因突變或進化的“銀彈思維”(Silver Bullet View),仿佛只要按下這個開關,人類就能瞬間獲得語言的神力。但這篇發表于 Science 的重磅綜述告訴我們:目前的證據顯示,沒有任何單一基因或一次突變可以在“語言技能上加點”,相反,語言源于多種能力在漫長演化史中的逐步匯聚。
面對這一復雜的科學難題,本篇 Science 綜述論文的作者們提出了一種全新的實證主義的生物文化框架。他們的核心洞察在于:語言不是一個整體的單一性狀,而是依賴于多種能力趨同的結果——從物理層面借用古老運動回路實現的“發聲學習” ,到認知層面將離散符號構建為層級結構的本能偏好 ,再到社會層面人類獨有的 Mitteilungsbedürfnis(德語,意為“交流/分享的需要”),以及文化層面通過代際迭代學習不斷打磨語言規律的機制。這些能力各自擁有獨立的深層演化歷史。正如眼睛并非憑空誕生,而是建立在祖先結構之上不斷修飾與重組的結果,語言的涌現也是古老生物基礎設施的擴展適應(Exaptation)。
這一框架強調了生物學與文化的雙重繼承系統:生物演化賦予了人類學習語言的“生物準備”,而語言本身的結構則是在代際間的社會互動和文化傳播中涌現的。
![]()
圖1:基因–文化共演化模型
生物演化提供先天認知-神經基礎設施(遺傳繼承),文化演化通過迭代學習篩選并放大弱偏置(文化繼承),二者構成雙重繼承系統。只要存在文化演化,即使個體只攜帶微弱先驗偏置,也能在群體層面產生與強先天約束相同的結果;若強偏置維持成本高昂,弱偏置必然出現。
這兩者通過復雜的基因-文化共演化(Gene-Culture Coevolution)循環相互作用,共同塑造了人類的語言能力。只要有文化演化存在,人類并不需要極強的先天基因偏置(Strong innate biases)。文化傳播就像一個放大器,能將微弱的弱先天偏置(Weak innate biases)放大為整齊劃一的語言結構。如果維持強偏置在遺傳上代價高昂,那么在長期演化中更有可能保留的是弱偏置,而由文化過程承擔更大一部分重整語言結構的工作。
發聲學習:深層同源與古老基因的重組
語言演化的第一個關鍵層面是發聲學習(Vocal Production Learning, VPL),即根據聽覺經驗修改聲音的能力。有趣的是,這種能力在動物界分布得極不均勻:我們的靈長類近親——如黑猩猩——這種能力顯著受限,但它卻在蝙蝠、鯨豚、大象和某些鳥類中獨立演化了出來。這一跨物種的趨同背后,可能依托于深度同源(Deep Homology)的神經基礎。
深度同源最著名的例子是 FOXP2 基因。最初,它因在患有嚴重言語障礙的KE家系中發生突變而被發現,一度被媒體奉為“語言基因”。
![]()
圖2-A:一個三代家庭,即 KE 家系,其中一半的親屬 (涂黑個體) 受到神經發育異常的影響,主要涉及兒童表達障礙,并伴有表達和接受性語言缺陷。受影響的親屬在 FOXP2 基因中攜帶一個 DNA 字母 (核苷酸) 的變化。DNA 中的這個小變化改變了氨基酸序列,從而改變了 FOXP2 編碼的調節蛋白質的關鍵部分的形狀,使其無法以正常方式發揮作用。DNA 測序的進展導致鑒定出超過 28 個額外的個體 (來自 17 個家庭), 攜帶不同的致病性 FOXP2 單核苷酸變體,語言發育問題是這些病例中最常見的特征。如圖片底部所示,盡管致病性變體有時從受影響的父母那里遺傳,但在許多情況下,它們在未受影響的父母的子代中重新出現。
但基因組學揭示,FOXP2 并非人類獨有,它在脊椎動物中高度保守,從鳥類到爬行類都有它的身影。它的真正功能是調節神經可塑性,幫助構建負責運動技能學習的回路。 在人類中,它被調用來支持復雜的言語運動;在斑胸草雀(Zebra Finches)中,它在“X區”(Area X,鳥類負責鳴唱學習的基底神經節核團)高表達,支持鳴唱學習。這意味著,語言的生物硬件其實是借用了古老的運動學習回路。
![]()
圖2-D:在斑胸草雀鳴唱學習腦區 Area X 降低 FoxP2 表達,干擾歌曲模仿并影響歌曲可變性,可能與多巴胺信號改變有關。
更令人興奮的是古DNA技術帶來的突破。分析尼安德特人和丹尼索瓦人的基因組顯示,FOXP2 的某些關鍵突變并非現代人獨有,而是在我們與黑猩猩分離后、但在與古人類分離前就已出現。將這些“人源化”的FOXP2 變體引入小鼠模型中,確實改變了小鼠紋狀體的可塑性和發聲特征。這證明了語言的生物硬件是通過對古老神經回路的修飾和重組而構建的,而非全新的創造。
![]()
圖3-E:將人族譜系上的FOXP2氨基酸替換‘人源化’地導入小鼠后,觀察到紋狀體多巴胺水平區域變化、可塑性增強;成年雄鼠超聲叫聲在頻率與音節復雜度上出現差異,且刺激-反應關聯學習模式改變。
除了基因,作者還提及了一個常被忽視的生物準備:內源性獎勵系統(Endogenous Reward)。人類嬰兒會自發地咿呀學語(Babbling),這種行為本身就是快樂的,不需要父母給糖吃。這種游戲化的發聲在鳴禽、鸚鵡和部分蝙蝠中也能觀察到,但在非 VPL 物種中卻極罕見。 研究發現,幼鳥在練習鳴唱時,大腦中的獎賞回路會被顯著激活,伴隨著伴隨著阿片類物質(Opioid)的水平升高和多巴胺(Dopamine)系統的參與。因此,VPL 的進化可能既取決于學習過程中神經回路的變化,也取決于潛在的內源性獎勵。作者特別強調,FOXP2 等基因只是復雜網絡中的一環,單靠某一次基因改變并不足以創造一顆會說話的大腦
語言結構:從混亂到有序的文化涌現
人類語言的另一個核心特征是系統性的結構,如組合性和層級結構。這些復雜的規則從何而來?作者指出,這是文化演化(Cultural Evolution)的產物,而非單純被編碼在基因中。
研究者們將目光投向了兩組特殊的“自然實驗”:家庭手語者(Homesigners)和尼加拉瓜手語(NSL)的使用者。前者是那些無法接觸任何語言輸入、在家庭中自發創造手勢的聽障兒童。研究發現,這些孤獨的創造者展現出了驚人的天賦——他們能自發地建立某種語序(例如“葡萄-吃”)。這證明人類大腦確實擁有一種先天的結構偏好或者說生物偏好(Biological bias)。
迭代學習(Iterated Learning)實驗也證實了這一點:當信號在模擬的“代際”間傳遞時,學習者的認知偏差會放大,導致語言結構從整體的、混亂的形式逐漸演變為分割的、組合的系統。這顛覆了傳統的認知,表明語言結構并非完全預設在人腦中,而是在適應人類大腦的學習與傳播過程中“生長”出來的。
社會基礎:分享的沖動與自我馴化
為什么只有人類發展出了如此復雜的語言?第三個關鍵層面在于社會動機。人類擁有一種獨特的、強烈的內在驅動力——Mitteilungsbedürfnis(德語,意為“交流/分享的需要”)。
與人類不同,即使是受過語言訓練的類人猿,其交流也主要局限于提出請求,極少為了“分享信息”而交流。這種對社交互動的內在獎勵機制,可能是語言演化的關鍵驅動力。人類的這種分享欲是如此強烈,以至于如果沒有現成的語言,我們會憑空創造一個(如尼加拉瓜手語)。
這種親社會性是如何演化而來的?作者引入了“人類自我馴化假說”(Human Self-Domestication Hypothesis)。該假說認為,人類在演化過程中經歷了類似動物馴化的選擇壓力——我們選擇了更低攻擊性、更寬容的同伴。
為了證明“馴化”如何改變交流系統,作者對比了野生的白腰文鳥(White-rumped Munia)和它的馴化后代十姊妹(Bengalese Finch)。馴化后的十姊妹壓力激素(糖皮質類固醇)水平更低,且大腦中的催產素(Oxytocin)水平更高。更少攻擊,對環境更少恐懼,更愿意探索 。最驚人的是,野生的白腰文鳥歌聲簡單刻板,而馴化后的十姊妹卻演化出了具有復雜語法結構(syntactic complexity)和高變異性的歌聲 。
這為人類語言演化提供了一個極佳的模型:若人類在長期演化中對低攻擊性和高寬容度個體施加偏好,則群體社會性將得到強化,帶來更高效的社會學習與文化傳播。社會學習的增強反過來支持更復雜文化結構的形成,并逐步生成對更強表達能力的交流系統的選擇壓力,從而促進語言的涌現。
展望:整合的未來
這篇論文強調,沒有任何單一的方法、工具或模型能獨自解開語言演化之謎。只有通過生物文化框架,將個體(語言學習)、群體(文化演化)和物種(生物演化)三個時間尺度結合起來,我們才能真正理解語言是如何誕生的。
未來的研究將更加關注生物獎勵系統在語言演化中的作用。同時,作者也呼吁停止無休止的“手勢起源 vs 語音起源”爭論,轉而關注多模態交流如何協同演化。這個新框架不僅重塑了我們對過去的理解,也為利用人工智能、動物模型和基因組學探索人類本質提供了全新的路線圖。
大模型2.0讀書會
o1模型代表大語言模型融合學習與推理的新范式。集智俱樂部聯合北京師范大學系統科學學院教授張江、Google DeepMind研究科學家馮熙棟、阿里巴巴強化學習研究員王維塤和中科院信工所張杰共同發起,本次讀書會將關注大模型推理范式的演進、基于搜索與蒙特卡洛樹的推理優化、基于強化學習的大模型優化、思維鏈方法與內化機制、自我改進與推理驗證。希望通過讀書會探索o1具體實現的技術路徑,幫助我們更好的理解機器推理和人工智能的本質。讀書會已完結,現在報名可加入社群并解鎖回放視頻權限。
詳情請見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.