網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Nat Neurosci：讓機(jī)器學(xué)會(huì)隨機(jī)應(yīng)變！科學(xué)家揭示神經(jīng)科學(xué)啟發(fā)自適應(yīng)AI機(jī)制

2026-01-07 18:28:08　來源: 腦聲常談

上海舉報(bào)

分享至

生物智能的一大特點(diǎn)就是“會(huì)變通”：動(dòng)物能根據(jù)環(huán)境變化和經(jīng)驗(yàn)不斷調(diào)整自己的行為，比如避開危險(xiǎn)、尋找食物、適應(yīng)新規(guī)則。這種持續(xù)學(xué)習(xí)和靈活應(yīng)變的能力，是生物智能的核心。但目前的人工智能大多缺乏這種真正的適應(yīng)性，它們?cè)诠潭〝?shù)據(jù)上訓(xùn)練后，一旦面對(duì)新環(huán)境或意外情況，往往就“卡殼”了。如何讓AI像動(dòng)物一樣，在真實(shí)世界中邊做邊學(xué)、實(shí)時(shí)調(diào)整，仍是人工智能領(lǐng)域的一大難題。

基于此，2025年12月30日，洛桑聯(lián)邦理工學(xué)院Mackenzie Weygandt Mathis研究團(tuán)隊(duì)在nature neuroscience雜志發(fā)表了“Leveraging insights from neuroscience to build adaptive artificial intelligence”揭示了利用神經(jīng)科學(xué)的洞見構(gòu)建自適應(yīng)人工智能。

當(dāng)前人工智能的前沿目標(biāo)，是發(fā)展“自適應(yīng)智能”即讓AI像動(dòng)物一樣，在運(yùn)行中持續(xù)學(xué)習(xí)、快速適應(yīng)新環(huán)境，并靈活應(yīng)對(duì)未知挑戰(zhàn)。這一思路深受神經(jīng)科學(xué)啟發(fā)：近年研究發(fā)現(xiàn)，動(dòng)物能不斷更新對(duì)世界的“內(nèi)部模型”，從而高效應(yīng)變。本文從行為和腦機(jī)制出發(fā)，梳理生物如何實(shí)現(xiàn)這種自適應(yīng)能力，回顧AI在模擬這些能力上的進(jìn)展并探討如何借鑒大腦原理，設(shè)計(jì)更靈活、更智能的新一代算法。

圖一生物智能的自適應(yīng)之道

近年來，神經(jīng)科學(xué)正轉(zhuǎn)向更貼近真實(shí)生活的實(shí)驗(yàn)方式：動(dòng)物不再只是按按鈕或走固定迷宮，而是在自由探索、動(dòng)態(tài)環(huán)境甚至虛擬現(xiàn)實(shí)中學(xué)習(xí)和決策。配合無標(biāo)記行為追蹤和大規(guī)模神經(jīng)記錄技術(shù)，研究者能精細(xì)解析動(dòng)物如何在單次實(shí)驗(yàn)中快速學(xué)習(xí)。

例如，小鼠在復(fù)雜迷宮中每小時(shí)可做2000次決策，僅需約10次嘗試就能學(xué)會(huì)找水，比傳統(tǒng)任務(wù)快上千倍；有些甚至能“舉一反三”，首次面對(duì)新任務(wù)就成功推理目標(biāo)順序，展現(xiàn)出零樣本學(xué)習(xí)能力。研究還發(fā)現(xiàn)，內(nèi)側(cè)前額葉皮層存在“任務(wù)結(jié)構(gòu)記憶”神經(jīng)元，可能像大腦的“內(nèi)部導(dǎo)航圖”，幫助動(dòng)物理解任務(wù)邏輯。

這種智能不僅限于實(shí)驗(yàn)室小鼠。自然界中，烏鴉會(huì)造工具，蜜蜂用“舞蹈”傳遞空間信息，狗能理解人類情緒，這些能力甚至催生了“虛擬動(dòng)物AI奧林匹克”，用動(dòng)物認(rèn)知啟發(fā)人工智能。

在運(yùn)動(dòng)控制領(lǐng)域，“內(nèi)部模型”（即大腦對(duì)身體與環(huán)境關(guān)系的預(yù)測(cè)）的快速更新是適應(yīng)性的核心。比如，在視覺被旋轉(zhuǎn)干擾的任務(wù)中，人或猴子能在幾百次嘗試內(nèi)校正動(dòng)作偏差。神經(jīng)記錄顯示，運(yùn)動(dòng)皮層會(huì)提前編碼所需力量，且這種調(diào)整會(huì)持久保留，證明內(nèi)部模型已被改寫。

腦聲常談建立了多個(gè)《動(dòng)物模型構(gòu)建與行為評(píng)估》交流群，群內(nèi)分享各種經(jīng)典和前沿的行為范式，共同交流解決動(dòng)物實(shí)驗(yàn)中遇到的棘手問題，避坑少走彎路！有需要的老師可以掃碼添加微信進(jìn)入討論群！

更直接的證據(jù)來自腦機(jī)接口（BMI）：動(dòng)物通過調(diào)節(jié)特定神經(jīng)元活動(dòng)來控制光標(biāo)。研究發(fā)現(xiàn)，并非所有神經(jīng)元都同樣“可訓(xùn)練”，例如，錐體束神經(jīng)元比端腦內(nèi)神經(jīng)元更容易被調(diào)控，可能因其連接更直接、反饋更高效。

這些發(fā)現(xiàn)共同指向一個(gè)核心觀點(diǎn)：生物智能的本質(zhì)，是在復(fù)雜、動(dòng)態(tài)環(huán)境中持續(xù)構(gòu)建并更新“內(nèi)部模型”的能力。而這一能力，正是當(dāng)前人工智能亟需借鑒的方向。

圖二大腦分層架構(gòu)如何驅(qū)動(dòng)預(yù)測(cè)學(xué)習(xí)

大腦的分層結(jié)構(gòu)（如皮層和小腦）并非偶然，而是支持高效學(xué)習(xí)的關(guān)鍵設(shè)計(jì)。越來越多證據(jù)表明：神經(jīng)架構(gòu)本身帶有“先天偏向”，能引導(dǎo)信息處理更貼合特定功能需求。

例如，皮層通過不同細(xì)胞類型和層級(jí)協(xié)同計(jì)算預(yù)測(cè)誤差即“預(yù)期”與“實(shí)際”之間的差距。研究發(fā)現(xiàn)，興奮性神經(jīng)元與多種抑制性中間神經(jīng)元在各層中精密配合，實(shí)現(xiàn)基于預(yù)測(cè)誤差的學(xué)習(xí)。這一機(jī)制延續(xù)了中腦“獎(jiǎng)賞預(yù)測(cè)誤差”的經(jīng)典發(fā)現(xiàn)，并揭示GABA能神經(jīng)元在門控獎(jiǎng)賞信號(hào)中的關(guān)鍵作用。

最新工作正嘗試統(tǒng)一不同類型的預(yù)測(cè)誤差：在感覺皮層，獎(jiǎng)賞相關(guān)線索會(huì)增強(qiáng)神經(jīng)反應(yīng)，降低預(yù)測(cè)誤差；當(dāng)規(guī)則突變時(shí)，眶額皮層發(fā)出“情境預(yù)測(cè)誤差”信號(hào)，下調(diào)信心；這些自上而下的誤差信號(hào)可動(dòng)態(tài)調(diào)節(jié)感覺區(qū)域活動(dòng)，形成跨腦區(qū)的預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)。

此外，單純依賴獎(jiǎng)賞的學(xué)習(xí)效率有限，但若結(jié)合感覺預(yù)測(cè)誤差，行為優(yōu)化效果顯著提升。這些發(fā)現(xiàn)提示：未來自適應(yīng)AI或需借鑒大腦的分層架構(gòu)與多模態(tài)預(yù)測(cè)誤差整合機(jī)制，而不僅是堆疊數(shù)據(jù)驅(qū)動(dòng)的模型。

圖三生物與人工系統(tǒng)中的記憶回放

持續(xù)學(xué)習(xí)旨在讓人工智能像生物大腦一樣，在不斷學(xué)習(xí)新任務(wù)的同時(shí)保留舊知識(shí)，避免“災(zāi)難性遺忘”。

為此，研究者發(fā)展了多種策略：彈性權(quán)重鞏固（EWC）通過約束關(guān)鍵參數(shù)減少任務(wù)干擾，可類比大腦中初級(jí)感覺區(qū)的穩(wěn)定性與高級(jí)皮層的可塑性；突觸智能則直接模擬生物突觸的可塑機(jī)制，使每個(gè)連接在學(xué)習(xí)新任務(wù)時(shí)自動(dòng)保護(hù)對(duì)舊任務(wù)重要的信息，支持高效在線學(xué)習(xí)；而記憶回放受海馬體記憶重放機(jī)制啟發(fā)，通過在訓(xùn)練中穿插舊樣本鞏固知識(shí)。

近年來，該思想已廣泛應(yīng)用于大模型如AmadeusGPT和MemGPT通過短時(shí)/長時(shí)記憶模塊突破上下文長度限制，Voyager則在游戲中回放過往經(jīng)驗(yàn)以迭代優(yōu)化技能。這些進(jìn)展表明，融合神經(jīng)科學(xué)原理與計(jì)算創(chuàng)新，是構(gòu)建真正自適應(yīng)、可持續(xù)學(xué)習(xí)的人工智能系統(tǒng)的關(guān)鍵方向。

圖四基礎(chǔ)模型與自適應(yīng)智能體

當(dāng)前人工智能主要依賴“基礎(chǔ)模型”（如GPT、Gemini）實(shí)現(xiàn)跨任務(wù)泛化，但這類單一通用架構(gòu)缺乏生物智能的核心特征：功能特化與模塊協(xié)同。自然界中，大腦由高度專業(yè)化的神經(jīng)回路組成（如視覺皮層處理邊緣、運(yùn)動(dòng)皮層計(jì)算發(fā)力），不同物種也演化出專用感知系統(tǒng)（如鷹眼、蝙蝠聲吶）。

受此啟發(fā)，作者提出一種新型自適應(yīng)智能體架構(gòu)：系統(tǒng)由多個(gè)預(yù)訓(xùn)練的專用編碼器（分別處理姿態(tài)、圖像、神經(jīng)信號(hào)等）組成，其輸出在共享潛在空間中聯(lián)合優(yōu)化，形成更豐富、更類腦的聯(lián)合表征；各編碼器動(dòng)態(tài)“鎖定”穩(wěn)健模塊，僅在性能下降時(shí)觸發(fā)局部更新（如通過持續(xù)學(xué)習(xí)或記憶回放），避免災(zāi)難性遺忘；

此外，該架構(gòu)配備專屬大語言模型，支持自然語言交互（如自動(dòng)分析“基因敲除是否影響行為”并生成假說），提升可解釋性。作者進(jìn)一步強(qiáng)調(diào)，未來AI應(yīng)借鑒大腦的細(xì)胞多樣性，引入興奮/抑制門控、生物時(shí)間延遲等機(jī)制，融合大模型能力、海量行為數(shù)據(jù)與類腦計(jì)算原理，構(gòu)建真正自主、自適應(yīng)且可進(jìn)化的智能系統(tǒng)。

總結(jié)

構(gòu)建真正自適應(yīng)的智能系統(tǒng)，關(guān)鍵在于融合神經(jīng)科學(xué)的兩大核心洞見：基于預(yù)測(cè)誤差更新的內(nèi)部模型與類腦的模塊化架構(gòu)。前者使系統(tǒng)能通過“預(yù)期-現(xiàn)實(shí)”差異持續(xù)優(yōu)化認(rèn)知，后者則通過功能特化又協(xié)同的編碼器模擬腦區(qū)分工。整合這些機(jī)制，有望顯著提升智能體在動(dòng)態(tài)環(huán)境中的魯棒性與泛化能力。更重要的是，此類系統(tǒng)可具身于機(jī)器人，在真實(shí)感覺運(yùn)動(dòng)閉環(huán)中驗(yàn)證其性能，并反過來為神經(jīng)科學(xué)提供探索心智機(jī)制的新理論框架與實(shí)驗(yàn)平臺(tái)。

文章來源

https://doi.org/10.1038/s41593-025-02169-w

腦聲小店基于深度科研洞察，專注為動(dòng)物實(shí)驗(yàn)提供"簡器械·精實(shí)驗(yàn)"解決方案。我們突破高精設(shè)備局限，開發(fā)手工定制化儀器及配件，通過科研巧思將基礎(chǔ)工具轉(zhuǎn)化為創(chuàng)新實(shí)驗(yàn)方案。產(chǎn)品涵蓋行為學(xué)裝置、操作輔助工具等，使實(shí)驗(yàn)室在保持操作簡效的同時(shí)，實(shí)現(xiàn)精細(xì)化數(shù)據(jù)采集，助力科研人員以創(chuàng)造性思維發(fā)掘簡易儀器的潛在科研價(jià)值。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.