![]()
生物智能的一大特點(diǎn)就是“會(huì)變通”:動(dòng)物能根據(jù)環(huán)境變化和經(jīng)驗(yàn)不斷調(diào)整自己的行為,比如避開危險(xiǎn)、尋找食物、適應(yīng)新規(guī)則。這種持續(xù)學(xué)習(xí)和靈活應(yīng)變的能力,是生物智能的核心。但目前的人工智能大多缺乏這種真正的適應(yīng)性,它們?cè)诠潭〝?shù)據(jù)上訓(xùn)練后,一旦面對(duì)新環(huán)境或意外情況,往往就“卡殼”了。如何讓AI像動(dòng)物一樣,在真實(shí)世界中邊做邊學(xué)、實(shí)時(shí)調(diào)整,仍是人工智能領(lǐng)域的一大難題。
基于此,2025年12月30日,洛桑聯(lián)邦理工學(xué)院Mackenzie Weygandt Mathis研究團(tuán)隊(duì)在nature neuroscience雜志發(fā)表了“Leveraging insights from neuroscience to build adaptive artificial intelligence”揭示了利用神經(jīng)科學(xué)的洞見構(gòu)建自適應(yīng)人工智能。
![]()
當(dāng)前人工智能的前沿目標(biāo),是發(fā)展“自適應(yīng)智能”即讓AI像動(dòng)物一樣,在運(yùn)行中持續(xù)學(xué)習(xí)、快速適應(yīng)新環(huán)境,并靈活應(yīng)對(duì)未知挑戰(zhàn)。這一思路深受神經(jīng)科學(xué)啟發(fā):近年研究發(fā)現(xiàn),動(dòng)物能不斷更新對(duì)世界的“內(nèi)部模型”,從而高效應(yīng)變。本文從行為和腦機(jī)制出發(fā),梳理生物如何實(shí)現(xiàn)這種自適應(yīng)能力,回顧AI在模擬這些能力上的進(jìn)展并探討如何借鑒大腦原理,設(shè)計(jì)更靈活、更智能的新一代算法。
![]()
圖一 生物智能的自適應(yīng)之道
近年來,神經(jīng)科學(xué)正轉(zhuǎn)向更貼近真實(shí)生活的實(shí)驗(yàn)方式:動(dòng)物不再只是按按鈕或走固定迷宮,而是在自由探索、動(dòng)態(tài)環(huán)境甚至虛擬現(xiàn)實(shí)中學(xué)習(xí)和決策。配合無標(biāo)記行為追蹤和大規(guī)模神經(jīng)記錄技術(shù),研究者能精細(xì)解析動(dòng)物如何在單次實(shí)驗(yàn)中快速學(xué)習(xí)。
例如,小鼠在復(fù)雜迷宮中每小時(shí)可做2000次決策,僅需約10次嘗試就能學(xué)會(huì)找水,比傳統(tǒng)任務(wù)快上千倍;有些甚至能“舉一反三”,首次面對(duì)新任務(wù)就成功推理目標(biāo)順序,展現(xiàn)出零樣本學(xué)習(xí)能力。研究還發(fā)現(xiàn),內(nèi)側(cè)前額葉皮層存在“任務(wù)結(jié)構(gòu)記憶”神經(jīng)元,可能像大腦的“內(nèi)部導(dǎo)航圖”,幫助動(dòng)物理解任務(wù)邏輯。
這種智能不僅限于實(shí)驗(yàn)室小鼠。自然界中,烏鴉會(huì)造工具,蜜蜂用“舞蹈”傳遞空間信息,狗能理解人類情緒,這些能力甚至催生了“虛擬動(dòng)物AI奧林匹克”,用動(dòng)物認(rèn)知啟發(fā)人工智能。
在運(yùn)動(dòng)控制領(lǐng)域,“內(nèi)部模型”(即大腦對(duì)身體與環(huán)境關(guān)系的預(yù)測(cè))的快速更新是適應(yīng)性的核心。比如,在視覺被旋轉(zhuǎn)干擾的任務(wù)中,人或猴子能在幾百次嘗試內(nèi)校正動(dòng)作偏差。神經(jīng)記錄顯示,運(yùn)動(dòng)皮層會(huì)提前編碼所需力量,且這種調(diào)整會(huì)持久保留,證明內(nèi)部模型已被改寫。
腦聲常談建立了多個(gè)《動(dòng)物模型構(gòu)建與行為評(píng)估》交流群,群內(nèi)分享各種經(jīng)典和前沿的行為范式,共同交流解決動(dòng)物實(shí)驗(yàn)中遇到的棘手問題,避坑少走彎路!有需要的老師可以掃碼添加微信進(jìn)入討論群!
更直接的證據(jù)來自腦機(jī)接口(BMI):動(dòng)物通過調(diào)節(jié)特定神經(jīng)元活動(dòng)來控制光標(biāo)。研究發(fā)現(xiàn),并非所有神經(jīng)元都同樣“可訓(xùn)練”,例如,錐體束神經(jīng)元比端腦內(nèi)神經(jīng)元更容易被調(diào)控,可能因其連接更直接、反饋更高效。
這些發(fā)現(xiàn)共同指向一個(gè)核心觀點(diǎn):生物智能的本質(zhì),是在復(fù)雜、動(dòng)態(tài)環(huán)境中持續(xù)構(gòu)建并更新“內(nèi)部模型”的能力。而這一能力,正是當(dāng)前人工智能亟需借鑒的方向。
![]()
圖二 大腦分層架構(gòu)如何驅(qū)動(dòng)預(yù)測(cè)學(xué)習(xí)
大腦的分層結(jié)構(gòu)(如皮層和小腦)并非偶然,而是支持高效學(xué)習(xí)的關(guān)鍵設(shè)計(jì)。越來越多證據(jù)表明:神經(jīng)架構(gòu)本身帶有“先天偏向”,能引導(dǎo)信息處理更貼合特定功能需求。
例如,皮層通過不同細(xì)胞類型和層級(jí)協(xié)同計(jì)算預(yù)測(cè)誤差即“預(yù)期”與“實(shí)際”之間的差距。研究發(fā)現(xiàn),興奮性神經(jīng)元與多種抑制性中間神經(jīng)元在各層中精密配合,實(shí)現(xiàn)基于預(yù)測(cè)誤差的學(xué)習(xí)。這一機(jī)制延續(xù)了中腦“獎(jiǎng)賞預(yù)測(cè)誤差”的經(jīng)典發(fā)現(xiàn),并揭示GABA能神經(jīng)元在門控獎(jiǎng)賞信號(hào)中的關(guān)鍵作用。
最新工作正嘗試統(tǒng)一不同類型的預(yù)測(cè)誤差:在感覺皮層,獎(jiǎng)賞相關(guān)線索會(huì)增強(qiáng)神經(jīng)反應(yīng),降低預(yù)測(cè)誤差;當(dāng)規(guī)則突變時(shí),眶額皮層發(fā)出“情境預(yù)測(cè)誤差”信號(hào),下調(diào)信心;這些自上而下的誤差信號(hào)可動(dòng)態(tài)調(diào)節(jié)感覺區(qū)域活動(dòng),形成跨腦區(qū)的預(yù)測(cè)學(xué)習(xí)網(wǎng)絡(luò)。
此外,單純依賴獎(jiǎng)賞的學(xué)習(xí)效率有限,但若結(jié)合感覺預(yù)測(cè)誤差,行為優(yōu)化效果顯著提升。這些發(fā)現(xiàn)提示:未來自適應(yīng)AI或需借鑒大腦的分層架構(gòu)與多模態(tài)預(yù)測(cè)誤差整合機(jī)制,而不僅是堆疊數(shù)據(jù)驅(qū)動(dòng)的模型。
![]()
圖三 生物與人工系統(tǒng)中的記憶回放
持續(xù)學(xué)習(xí)旨在讓人工智能像生物大腦一樣,在不斷學(xué)習(xí)新任務(wù)的同時(shí)保留舊知識(shí),避免“災(zāi)難性遺忘”。
為此,研究者發(fā)展了多種策略:彈性權(quán)重鞏固(EWC)通過約束關(guān)鍵參數(shù)減少任務(wù)干擾,可類比大腦中初級(jí)感覺區(qū)的穩(wěn)定性與高級(jí)皮層的可塑性;突觸智能則直接模擬生物突觸的可塑機(jī)制,使每個(gè)連接在學(xué)習(xí)新任務(wù)時(shí)自動(dòng)保護(hù)對(duì)舊任務(wù)重要的信息,支持高效在線學(xué)習(xí);而記憶回放受海馬體記憶重放機(jī)制啟發(fā),通過在訓(xùn)練中穿插舊樣本鞏固知識(shí)。
近年來,該思想已廣泛應(yīng)用于大模型如AmadeusGPT和MemGPT通過短時(shí)/長時(shí)記憶模塊突破上下文長度限制,Voyager則在游戲中回放過往經(jīng)驗(yàn)以迭代優(yōu)化技能。這些進(jìn)展表明,融合神經(jīng)科學(xué)原理與計(jì)算創(chuàng)新,是構(gòu)建真正自適應(yīng)、可持續(xù)學(xué)習(xí)的人工智能系統(tǒng)的關(guān)鍵方向。
![]()
圖四 基礎(chǔ)模型與自適應(yīng)智能體
當(dāng)前人工智能主要依賴“基礎(chǔ)模型”(如GPT、Gemini)實(shí)現(xiàn)跨任務(wù)泛化,但這類單一通用架構(gòu)缺乏生物智能的核心特征:功能特化與模塊協(xié)同。自然界中,大腦由高度專業(yè)化的神經(jīng)回路組成(如視覺皮層處理邊緣、運(yùn)動(dòng)皮層計(jì)算發(fā)力),不同物種也演化出專用感知系統(tǒng)(如鷹眼、蝙蝠聲吶)。
受此啟發(fā),作者提出一種新型自適應(yīng)智能體架構(gòu):系統(tǒng)由多個(gè)預(yù)訓(xùn)練的專用編碼器(分別處理姿態(tài)、圖像、神經(jīng)信號(hào)等)組成,其輸出在共享潛在空間中聯(lián)合優(yōu)化,形成更豐富、更類腦的聯(lián)合表征;各編碼器動(dòng)態(tài)“鎖定”穩(wěn)健模塊,僅在性能下降時(shí)觸發(fā)局部更新(如通過持續(xù)學(xué)習(xí)或記憶回放),避免災(zāi)難性遺忘;
此外,該架構(gòu)配備專屬大語言模型,支持自然語言交互(如自動(dòng)分析“基因敲除是否影響行為”并生成假說),提升可解釋性。作者進(jìn)一步強(qiáng)調(diào),未來AI應(yīng)借鑒大腦的細(xì)胞多樣性,引入興奮/抑制門控、生物時(shí)間延遲等機(jī)制,融合大模型能力、海量行為數(shù)據(jù)與類腦計(jì)算原理,構(gòu)建真正自主、自適應(yīng)且可進(jìn)化的智能系統(tǒng)。
總結(jié)
構(gòu)建真正自適應(yīng)的智能系統(tǒng),關(guān)鍵在于融合神經(jīng)科學(xué)的兩大核心洞見:基于預(yù)測(cè)誤差更新的內(nèi)部模型與類腦的模塊化架構(gòu)。前者使系統(tǒng)能通過“預(yù)期-現(xiàn)實(shí)”差異持續(xù)優(yōu)化認(rèn)知,后者則通過功能特化又協(xié)同的編碼器模擬腦區(qū)分工。整合這些機(jī)制,有望顯著提升智能體在動(dòng)態(tài)環(huán)境中的魯棒性與泛化能力。更重要的是,此類系統(tǒng)可具身于機(jī)器人,在真實(shí)感覺運(yùn)動(dòng)閉環(huán)中驗(yàn)證其性能,并反過來為神經(jīng)科學(xué)提供探索心智機(jī)制的新理論框架與實(shí)驗(yàn)平臺(tái)。
文章來源
https://doi.org/10.1038/s41593-025-02169-w
腦聲小店基于深度科研洞察,專注為動(dòng)物實(shí)驗(yàn)提供"簡器械·精實(shí)驗(yàn)"解決方案。我們突破高精設(shè)備局限,開發(fā)手工定制化儀器及配件,通過科研巧思將基礎(chǔ)工具轉(zhuǎn)化為創(chuàng)新實(shí)驗(yàn)方案。產(chǎn)品涵蓋行為學(xué)裝置、操作輔助工具等,使實(shí)驗(yàn)室在保持操作簡效的同時(shí),實(shí)現(xiàn)精細(xì)化數(shù)據(jù)采集,助力科研人員以創(chuàng)造性思維發(fā)掘簡易儀器的潛在科研價(jià)值。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.