Nature 重磅發(fā)布：人類一眼頓悟的 one-shot 學(xué)習(xí)機(jī)制，可能是AI 的下一次范式革命

2026-02-06 20:50:41　來源: 人工智能學(xué)家

北京舉報(bào)

分享至

如果你曾看過那張著名的“達(dá)爾馬提亞狗圖”，你大概體驗(yàn)過一種奇妙的瞬間。第一眼，你只看到一團(tuán)混亂的黑白斑點(diǎn)，第二眼，當(dāng)有人告訴你“這是只狗”，你的視覺系統(tǒng)仿佛被點(diǎn)亮，從此再也無法“看不見那只狗”。

科學(xué)家把這種現(xiàn)象稱為單次感知學(xué)習(xí)（one-shot perceptual learning）。它的神奇之處在于只需要一次清晰圖像的呈現(xiàn)，就能永久改變你對退化圖像的感知方式。

在實(shí)驗(yàn)室里，這種現(xiàn)象常用“Mooney 圖”來研究——一種極度退化、幾乎無法識別的黑白圖像。但只要你看過一次對應(yīng)的清晰原圖，再回頭看 Mooney 圖，你會驚訝地發(fā)現(xiàn)它突然變得“顯而易見”。

這種“頓悟式學(xué)習(xí)”與我們熟悉的“練習(xí)成就完美”完全不同。

傳統(tǒng)的視覺學(xué)習(xí)需要成百上千次重復(fù)訓(xùn)練，像肌肉記憶一樣慢慢積累；而 one-shot 學(xué)習(xí)更像是大腦的“閃存寫入”，一次寫入，永久生效。

然而，現(xiàn)代 AI 雖然在圖像識別上已經(jīng)強(qiáng)到離譜，卻依然難以復(fù)現(xiàn)這種能力。深度學(xué)習(xí)模型需要海量數(shù)據(jù)、長時(shí)間訓(xùn)練、巨量算力，才能學(xué)會識別一個(gè)新類別。

相比之下，人類只需要一次體驗(yàn)。

這背后到底發(fā)生了什么？大腦是如何做到一次寫入、長期保持、不遺忘舊知識，不破壞已有視覺系統(tǒng)，還能在毫秒級時(shí)間內(nèi)調(diào)用這些先驗(yàn)？

更關(guān)鍵的是這種快速學(xué)習(xí)到底發(fā)生在大腦的哪個(gè)區(qū)域？先驗(yàn)知識以什么格式存儲？是概念？是形狀？還是某種抽象的視覺模板？神經(jīng)機(jī)制如何避免“災(zāi)難性遺忘”，而深度學(xué)習(xí)模型卻做不到？我們能否構(gòu)建一個(gè)真正具備人類式one-shot學(xué)習(xí)能力的AI？

圖1 |心理物理學(xué)實(shí)驗(yàn)的范式和假設(shè)。

這些問題長期以來懸而未決。直到這篇《Neural and computational mechanisms underlying one-shot perceptual learning in humans》發(fā)表在Nature Communications的研究出現(xiàn)。

這項(xiàng)研究由紐約大學(xué)（NYU）和 Mount Sinai 醫(yī)學(xué)院的跨學(xué)科團(tuán)隊(duì)聯(lián)合完成，成員橫跨認(rèn)知神經(jīng)科學(xué)、視覺神經(jīng)科學(xué)、臨床神經(jīng)外科（提供 iEEG 數(shù)據(jù)）、生物醫(yī)學(xué)工程、計(jì)算機(jī)工程、數(shù)據(jù)科學(xué)與深度學(xué)習(xí)。

團(tuán)隊(duì)由 Biyu J. He與 Eric Oermann 共同領(lǐng)導(dǎo)，他們在視覺認(rèn)知、神經(jīng)電生理和醫(yī)學(xué) AI 領(lǐng)域都處于國際前沿。

這項(xiàng)研究的意義在于它不僅回答了“人類如何做到 one-shot 學(xué)習(xí)”這一神經(jīng)科學(xué)難題，還首次構(gòu)建了一個(gè)能模擬人類單次感知學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)模型，并將其與人腦的神經(jīng)編碼進(jìn)行對齊。

01研究設(shè)計(jì)：三條證據(jù)鏈鎖定大腦中的“先驗(yàn)存儲器”

為了破解 one-shot 感知學(xué)習(xí)的神經(jīng)與計(jì)算機(jī)制，研究團(tuán)隊(duì)設(shè)計(jì)了一套極其嚴(yán)謹(jǐn)、跨層級的研究方案。他們沒有依賴單一實(shí)驗(yàn)，而是從行為、神經(jīng)表征、時(shí)間動態(tài)和計(jì)算模型四個(gè)維度同時(shí)出擊，構(gòu)建了一條“閉環(huán)式證據(jù)鏈”。

這套設(shè)計(jì)可以概括為一句話：從行為推斷先驗(yàn)結(jié)構(gòu)，從神經(jīng)定位存儲區(qū)域，從時(shí)間確定激活順序，再用模型復(fù)現(xiàn)機(jī)制。

整個(gè)研究包含四條互補(bǔ)證據(jù)鏈。

首先是行為層面。研究者通過操控清晰圖像的方向、大小、位置、類別等屬性，觀察這些操控是否會破壞 one-shot 學(xué)習(xí)。如果某種操控不影響學(xué)習(xí)，就說明大腦中的“先驗(yàn)知識”對該屬性具有不變性；反之，則說明先驗(yàn)依賴該屬性。通過這種方式，他們繪制出一張“先驗(yàn)不變性地圖”，從行為層面推斷先驗(yàn)可能存儲在哪個(gè)腦區(qū)。

接著是神經(jīng)層面。研究者使用 7T fMRI 測量不同腦區(qū)對這些操控的神經(jīng)表征差異。如果某個(gè)腦區(qū)的神經(jīng)表征不變性結(jié)構(gòu)與行為不變性結(jié)構(gòu)一致，就說明它可能是先驗(yàn)的存儲地。這一步是行為推斷的神經(jīng)驗(yàn)證。

然后是時(shí)間維度。通過對癲癇患者的顱內(nèi)電記錄（iEEG），研究者測量不同腦區(qū)在學(xué)習(xí)后對 Mooney 圖的反應(yīng)變化。先驗(yàn)存儲區(qū)應(yīng)該是最早出現(xiàn)學(xué)習(xí)效應(yīng)的區(qū)域。這一步提供了時(shí)間因果證據(jù)。

最后是計(jì)算層面。研究團(tuán)隊(duì)構(gòu)建了一個(gè)具備 one-shot 學(xué)習(xí)能力的深度神經(jīng)網(wǎng)絡(luò)模型，并將模型中學(xué)到的“先驗(yàn)”與人腦不同腦區(qū)的神經(jīng)編碼進(jìn)行對齊。如果模型先驗(yàn)與某個(gè)腦區(qū)的神經(jīng)表征最相似，就進(jìn)一步支持該腦區(qū)是人類先驗(yàn)的存儲地。

這四條證據(jù)鏈最終指向同一個(gè)答案：高層視覺皮層（HLVC）是人類one-shot感知學(xué)習(xí)的核心存儲器。

02心理物理學(xué)：先驗(yàn)知識的“不變性地圖”揭示其存儲位置

如果說 one-shot 感知學(xué)習(xí)是一種“頓悟”，那么心理物理學(xué)實(shí)驗(yàn)就是在拆解這場頓悟背后的“視覺魔術(shù)”。研究團(tuán)隊(duì)從最基礎(chǔ)的行為層面入手，試圖回答一個(gè)看似簡單卻極其關(guān)鍵的問題——大腦到底存了一個(gè)什么樣的“先驗(yàn)?zāi)０濉保屛覀冊诳催^一次清晰圖像后就能永遠(yuǎn)識別那張退化圖？

為了回答這個(gè)問題，他們設(shè)計(jì)了一套極其巧妙的實(shí)驗(yàn)范式。

圖2|映射感知先驗(yàn)的不變性屬性。

Mooney圖：為什么它難得離譜？

Mooney 圖是一種極端退化的黑白圖像，幾乎沒有灰度、沒有邊緣、沒有紋理，只有大片黑白塊。對視覺系統(tǒng)來說，這就像把一段旋律只留下節(jié)奏、去掉音高——信息少得可憐。

所以第一次看到 Mooney 圖時(shí)，你的大腦幾乎無法從中提取任何結(jié)構(gòu)。但只要你看過一次對應(yīng)的清晰原圖，再回頭看 Mooney 圖，你會突然發(fā)現(xiàn)：

“啊，這不就是一只狗/一個(gè)人/一輛車嗎？”

這種“瞬間開竅”的體驗(yàn)，就是單次感知學(xué)習(xí)的核心。

單次呈現(xiàn)清晰圖像如何瞬間改變感知？

研究者讓受試者先看 Mooney 圖（通常認(rèn)不出來），然后只呈現(xiàn)一次對應(yīng)的清晰圖像，再讓他們看同一張Mooney 圖。

結(jié)果幾乎所有人都能立刻認(rèn)出圖像內(nèi)容，而且這種效果能持續(xù)數(shù)月。

這說明大腦在一次呈現(xiàn)中就寫入了某種“先驗(yàn)知識”。但這個(gè)先驗(yàn)到底是什么？是形狀？是輪廓？是空間布局？還是某種抽象的視覺模板？

為了回答這個(gè)問題，研究團(tuán)隊(duì)開始“折磨”清晰圖像。

操控清晰圖像：方向、大小、位置，一項(xiàng)項(xiàng)試過去

研究者的邏輯非常直接，如果改變某個(gè)屬性后學(xué)習(xí)效果不變，說明大腦的先驗(yàn)對這個(gè)屬性“不敏感”。反之，則說明先驗(yàn)依賴這個(gè)屬性。

這就像在測試一個(gè)鎖的密碼：你改動某一位數(shù)字，鎖還能打開，那這一位就不是關(guān)鍵位。

于是他們對清晰圖像做了三類操控。

方向變化：翻轉(zhuǎn)、旋轉(zhuǎn)——學(xué)習(xí)變?nèi)醯粫?/p>

當(dāng)清晰圖像被左右翻轉(zhuǎn)或旋轉(zhuǎn) 90°后，受試者的學(xué)習(xí)效果明顯下降，但并沒有完全消失。

這意味著大腦的先驗(yàn)對方向部分不變，但方向仍然是先驗(yàn)的一部分。

這種“部分不變性”非常像高層視覺皮層（HLVC）的編碼特征：它對方向有一定不變性，但不是完全不變。

大小變化：6°、12°、24°——完全不影響學(xué)習(xí)

這是最關(guān)鍵的發(fā)現(xiàn)之一。

無論清晰圖像縮小一半還是放大一倍，學(xué)習(xí)效果都幾乎不變。

這直接排除了早期視覺皮層（V1–V4）作為先驗(yàn)存儲區(qū)的可能性，因?yàn)檫@些區(qū)域?qū)Υ笮O其敏感，圖像大小變化會徹底改變它們的神經(jīng)編碼。

而高層視覺皮層（尤其 IT 區(qū)）對大小高度不變。

這是一條非常強(qiáng)的證據(jù)。

位置變化：偏移 6°——學(xué)習(xí)變?nèi)醯幌?/p>

當(dāng)清晰圖像被移到左側(cè)或右側(cè) 6°時(shí)，學(xué)習(xí)效果下降，但依然存在。

這再次呈現(xiàn)出“部分不變性”的特征。

結(jié)合方向與大小的結(jié)果，一個(gè)清晰的模式浮現(xiàn)出來：

大小：完全不變
方向：部分不變
位置：部分不變

這正是高層視覺皮層（HLVC）的典型編碼特征。

概念 vs 感知：換成同類不同 exemplar → 學(xué)習(xí)直接消失

研究者做了一個(gè)非常關(guān)鍵的操控，把清晰圖像換成同一類別的另一張圖。

比如 Mooney 圖對應(yīng)的是一只特定姿態(tài)的貓，但清晰圖像換成另一只貓。

結(jié)果學(xué)習(xí)效果直接消失。

這說明大腦存儲的先驗(yàn)不是“貓”這個(gè)概念，而是“這張貓圖的具體視覺結(jié)構(gòu)”。

換句話說，先驗(yàn)存儲在感知空間而不是概念空間。

這與 IT 區(qū)的神經(jīng)編碼完全一致， IT 區(qū)雖然能區(qū)分類別，但它的編碼本質(zhì)上仍是具體視覺特征的顯式表示。

M通路vs P通路：兩條通路都能誘發(fā)學(xué)習(xí)

研究者還測試了低對比度（偏向 M 通路）、紅綠等亮度（偏向 P 通路），

結(jié)果兩者都能誘發(fā)學(xué)習(xí)。

這說明先驗(yàn)不依賴某一條視覺通路，但兩條通路都能投射到 IT 區(qū)，再次指向 HLVC 作為先驗(yàn)存儲區(qū)。

至此，行為層面的證據(jù)已經(jīng)非常清晰，先驗(yàn)的“不變性結(jié)構(gòu)”與高層視覺皮層的編碼特性高度一致。

03HLVC的神經(jīng)表征與行為先驗(yàn)完全一致

行為實(shí)驗(yàn)告訴我們先驗(yàn)長什么樣，但 fMRI 能告訴我們大腦哪里真的以這種方式編碼圖像。

研究團(tuán)隊(duì)使用 7T 超高場 fMRI，對每張圖像在不同操控條件下的神經(jīng)表征進(jìn)行建模。

構(gòu)建神經(jīng) RDM：70×70的圖像-條件矩陣

他們選取了 10 張圖像 × 7 種操控條件，構(gòu)建了一個(gè) 70×70 的神經(jīng)表征距離矩陣（RDM）。

每個(gè)元素代表：

“圖 A 在條件 X 與圖 B 在條件 Y 的神經(jīng)表征差異有多大？”

這是表征相似性分析（RSA）的核心。

圖3 |基于模型的RSA結(jié)果（n=10名受試者）。

哪些腦區(qū)具有“操控不變性”？

研究者把不同腦區(qū)的神經(jīng) RDM拿來對比，結(jié)果非常有意思。

HLVC（LO1、LO2、FC）：對方向、大小、位置操控表現(xiàn)出顯著不變性與行為結(jié)果高度一致。
V4：有部分不變性，但不完全匹配。
EVC（V1–V3）：完全不匹配（對大小極其敏感）。
FPN、DMN：雖然任務(wù)中活躍，但不具備這種不變性結(jié)構(gòu)。

只有 HLVC 的神經(jīng)表征與行為推斷的“先驗(yàn)結(jié)構(gòu)”一致。

模型 RDM vs 神經(jīng)RDM：最終對齊

研究者基于行為實(shí)驗(yàn)構(gòu)建了一個(gè)“先驗(yàn)?zāi)Ｐ?RDM”，包含三種距離等級：

大小變化：低距離。
方向/位置變化：中距離。
不同 exemplar：高距離。

然后與各腦區(qū)的神經(jīng) RDM 進(jìn)行相關(guān)分析。

結(jié)果只有一個(gè)腦區(qū)顯著相關(guān)：HLVC（尤其LO2和FC）

這意味著HLVC是最可能的先驗(yàn)存儲部位。

04顱內(nèi)電記錄（iEEG）：HLVC 最早出現(xiàn)學(xué)習(xí)效應(yīng)

如果說心理物理學(xué)告訴我們“先驗(yàn)長什么樣”，fMRI 告訴我們“先驗(yàn)存在哪里”，那么顱內(nèi)電記錄（iEEG）則回答了一個(gè)更尖銳的問題：誰是最先被先驗(yàn)點(diǎn)亮的腦區(qū)？

這是一個(gè)時(shí)間維度的問題，而時(shí)間，往往是因果的關(guān)鍵。

圖4|學(xué)習(xí)誘導(dǎo)活動變化的時(shí)間特性。

為什么時(shí)間維度重要？

在大腦中，信息流動是有順序的。如果某個(gè)區(qū)域真的存儲了先驗(yàn)，那么當(dāng)你再次看到 Mooney 圖時(shí)，它應(yīng)該是最早被激活的區(qū)域—— 就像一個(gè)熟悉的旋律響起，你腦海中最先浮現(xiàn)的那段記憶，必然是它的“源頭”。

先驗(yàn)存儲區(qū)必須在視覺輸入到達(dá)后最先發(fā)生變化，而不是等別人告訴它“該怎么想”。

這就是 iEEG 的價(jià)值所在。它不像 fMRI 那樣“慢吞吞”，而是毫秒級的神經(jīng)電信號，能精確捕捉大腦中哪一塊皮層最先“覺醒”。

HLVC在~150 ms出現(xiàn)學(xué)習(xí)效應(yīng)

研究團(tuán)隊(duì)在癲癇患者中記錄了顱內(nèi)電信號，比較學(xué)習(xí)前后 Mooney 圖觸發(fā)的神經(jīng)反應(yīng)。

結(jié)果非常干脆：

高層視覺皮層（HLVC）在大約150毫秒時(shí)就出現(xiàn)了顯著的學(xué)習(xí)效應(yīng)。

這意味HLVC 在看到退化圖像時(shí)，會迅速調(diào)用剛剛寫入的先驗(yàn)，并在極短時(shí)間內(nèi)改變對圖像的解釋方式。

這不是“被動響應(yīng)”，而是“主動調(diào)控”。

FPN、DMN的變化更晚出現(xiàn)

相比之下，前額-頂葉網(wǎng)絡(luò)（FPN）和默認(rèn)模式網(wǎng)絡(luò)（DMN）雖然也會在學(xué)習(xí)后表現(xiàn)出變化，但時(shí)間明顯滯后。

這說明它們可能參與注意、解釋、決策等高階過程，但不是先驗(yàn)的存儲者，更像是“接收來自 HLVC 的更新信息”。

這條時(shí)間因果證據(jù)與行為和 fMRI 的空間證據(jù)完美對齊：

HLVC是先驗(yàn)的源頭，而不是被動接收者。

05深度神經(jīng)網(wǎng)絡(luò)模型：構(gòu)建一個(gè)能“一眼頓悟”的 AI

科學(xué)研究最迷人的地方在于它不僅解釋世界，還能啟發(fā)我們構(gòu)建新的系統(tǒng)。

當(dāng)研究團(tuán)隊(duì)已經(jīng)用行為、fMRI、iEEG 三條證據(jù)鏈鎖定HLVC 后，他們做了一件更大膽的事——構(gòu)建一個(gè)能像人類一樣進(jìn)行one-shot感知學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)。

這不是“再訓(xùn)練一下模型”那么簡單，而是一次對AI 學(xué)習(xí)機(jī)制的重新設(shè)計(jì)。

圖5 |模型顯示了感知學(xué)習(xí)效果并預(yù)測了人類的學(xué)習(xí)結(jié)果。

模型架構(gòu)：Vision Transformer + Top-down Feedback

研究團(tuán)隊(duì)以 Vision Transformer（ViT）為基礎(chǔ)，但加入了一個(gè)關(guān)鍵機(jī)制：自頂向下反饋（Top-down Feedback）。

這一步非常關(guān)鍵，因?yàn)槿四X的視覺系統(tǒng)不是單向的，高層視覺區(qū)域會不斷向低層區(qū)域發(fā)送反饋，這種反饋是“先驗(yàn)注入”的核心機(jī)制。

傳統(tǒng)的深度學(xué)習(xí)模型幾乎都是“自下而上”的，缺乏這種動態(tài)調(diào)控能力。而加入反饋后，模型可以在一次呈現(xiàn)清晰圖像后，更新內(nèi)部先驗(yàn)，在下一次看到 Mooney 圖時(shí)，用先驗(yàn)去“修正”對退化圖像的解釋。

這就是人工系統(tǒng)中的“頓悟”。

模型結(jié)果：AI 真的學(xué)會了“一眼頓悟”

令人驚喜的是，這個(gè)模型不僅能進(jìn)行 one-shot 學(xué)習(xí)，而且表現(xiàn)得非常“人類”。

研究團(tuán)隊(duì)發(fā)現(xiàn)模型成功復(fù)現(xiàn)了人類的整體學(xué)習(xí)幅度。

也就是說看一次清晰圖像，模型對 Mooney 圖的識別率顯著提升，幅度與人類非常接近。

更令人震驚的是模型能預(yù)測不同圖像的學(xué)習(xí)難度差異（image-specific）。

或者說哪些 Mooney 圖更容易被人類“頓悟”，哪些更難，模型都能提前預(yù)測。

這說明模型不僅學(xué)到了“先驗(yàn)”，還學(xué)到了“先驗(yàn)的結(jié)構(gòu)”。

模型學(xué)到的“先驗(yàn)”與 HLVC 神經(jīng)編碼最相似

研究團(tuán)隊(duì)進(jìn)一步把模型內(nèi)部的“先驗(yàn)表征”與人腦不同區(qū)域的神經(jīng)編碼進(jìn)行對齊。

結(jié)果再次指向同一個(gè)答案，模型的先驗(yàn)與HLVC的神經(jīng)編碼最相似。

這意味著模型學(xué)到的不是“概念標(biāo)簽”，而是類似 HLVC 的“結(jié)構(gòu)化感知模板”，這種模板具有與人類相同的不變性結(jié)構(gòu)。

這不僅驗(yàn)證了模型的合理性，也驗(yàn)證了人腦的機(jī)制。

計(jì)算模型與人腦在先驗(yàn)格式上高度一致

四條證據(jù)鏈——行為、fMRI、iEEG、模型——最終收斂到一個(gè)令人信服的結(jié)論：

人類的one-shot感知學(xué)習(xí)依賴HLVC的快速可塑性與自頂向下反饋機(jī)制。而一個(gè)具備類似結(jié)構(gòu)的深度模型，也能實(shí)現(xiàn)“一眼頓悟”。

這不僅是神經(jīng)科學(xué)的突破，也是 AI 的啟示。

未來的快速學(xué)習(xí)模型，可能不再依賴海量數(shù)據(jù)和反復(fù)訓(xùn)練，而是依賴高層表征的快速寫入，自頂向下的動態(tài)調(diào)控，感知空間的結(jié)構(gòu)化先驗(yàn)。

AI要想更像人類，就必須學(xué)會“用先驗(yàn)看世界”。

06人類 one-shot 感知學(xué)習(xí)的神經(jīng)與計(jì)算機(jī)制

當(dāng)我們把心理物理學(xué)的不變性地圖、7T fMRI 的空間表征、iEEG 的時(shí)間因果證據(jù)，以及深度神經(jīng)網(wǎng)絡(luò)的計(jì)算模擬放在一起時(shí)，一個(gè)極其清晰、幾乎無可辯駁的圖景浮現(xiàn)出來，人類的單次感知學(xué)習(xí)并不是魔法，而是一套高度結(jié)構(gòu)化、層級分明、效率驚人的神經(jīng)計(jì)算機(jī)制。

這套機(jī)制的核心，就是高層視覺皮層（HLVC）。

先驗(yàn)存儲在 HLVC，而非海馬體或前額葉

長期以來，很多人以為“快速學(xué)習(xí) = 海馬體”，因?yàn)?episodic memory（情景記憶）確實(shí)依賴海馬體，并且也是“看一次就記住”。但這項(xiàng)研究用行為學(xué)和神經(jīng)證據(jù)明確告訴我們：one-shot感知學(xué)習(xí)≠ episodic memory。

海馬體負(fù)責(zé)的是“你見過這張圖嗎？” HLVC 負(fù)責(zé)的是“你能看懂這張圖嗎？”

這兩者是完全不同的任務(wù)。

前額葉和頂葉網(wǎng)絡(luò)雖然在任務(wù)中活躍，但它們更像是“調(diào)度中心”，而不是“存儲倉庫”。真正寫入先驗(yàn)、真正發(fā)生可塑性的地方，是 HLVC。

這意味著人類的快速感知學(xué)習(xí)是皮層內(nèi)學(xué)習(xí)，是視覺系統(tǒng)自身的快速重構(gòu)，是一種“直接寫入視覺模型”的機(jī)制，而不是“寫入記憶庫再調(diào)用”。

這與現(xiàn)代 AI 的訓(xùn)練方式形成鮮明對比。

先驗(yàn)格式：部分不變、感知空間、結(jié)構(gòu)化特征編碼

研究的心理物理學(xué)部分揭示了先驗(yàn)的“格式”：

對大小完全不變。
對方向、位置部分不變。
對 exemplar 完全敏感。
存儲在感知空間，而非概念空間。

這說明先驗(yàn)不是抽象的“類別標(biāo)簽”，不是“這是貓”，而是“這張貓圖的結(jié)構(gòu)化視覺模板”。

它包含邊緣、形狀、空間布局、局部特征的組合方式。

這些都是 HLVC（尤其 IT 區(qū)）最擅長編碼的內(nèi)容。

先驗(yàn)是一種可直接作用于視覺處理的結(jié)構(gòu)化模板，而不是語言或概念層面的知識。

這也解釋了為什么一次呈現(xiàn)就能改變感知，你不是“學(xué)會了一個(gè)概念”，而是“更新了視覺模型本身”。

圖6 |大腦預(yù)測對比揭示了FC在學(xué)習(xí)中的強(qiáng)烈參與。

機(jī)制模型：HLVC → 自頂向下反饋 → 早期視覺皮層

把所有證據(jù)整合起來，我們得到一個(gè)極其優(yōu)雅的機(jī)制模型，HLVC存儲先驗(yàn)→再次看到Mooney圖時(shí)先驗(yàn)被激活→通過反饋調(diào)節(jié)早期視覺皮層→讓退化圖像變得可識別。

這是一種“從上往下”的視覺重建過程。

第一次看到 Mooney 圖時(shí)，早期視覺皮層只能看到混亂的黑白塊；但當(dāng) HLVC 擁有了先驗(yàn)，它會在毫秒級時(shí)間內(nèi)把“正確的解釋”反饋給低層視覺區(qū)域，讓它們重新組織輸入。

這就是為什么Mooney 圖第一次看不懂，第二次就“突然顯而易見”，而且這種效果能持續(xù)數(shù)月。

因?yàn)槟悴皇怯涀×藞D像，而是更新了視覺系統(tǒng)的內(nèi)部結(jié)構(gòu)。

07從人腦到 AI 的未來啟示

快速學(xué)習(xí)不是“微調(diào)參數(shù)”，而是“寫入先驗(yàn)”

這項(xiàng)研究對 AI 的啟示非常深刻。

現(xiàn)代深度學(xué)習(xí)模型的學(xué)習(xí)方式是大量樣本、大量梯度下降、大量參數(shù)更新、訓(xùn)練一次，推理一次。

但人類的 one-shot 學(xué)習(xí)不是這樣。

人類的快速學(xué)習(xí)依賴高層表征的快速寫入，自頂向下的動態(tài)調(diào)控感知，空間的結(jié)構(gòu)化先驗(yàn)。

這意味著未來的 AI 想要具備真正的人類式 one-shot 學(xué)習(xí)能力，必須從“訓(xùn)練范式”轉(zhuǎn)向“結(jié)構(gòu)范式”。

不是簡單的參數(shù)微調(diào)，而是構(gòu)建一個(gè)能快速寫入高層表征、并通過反饋機(jī)制影響低層處理的系統(tǒng)。

AI 不應(yīng)該只會“學(xué)會分類”，而應(yīng)該學(xué)會“更新自己的視覺模型”。這才是人類式學(xué)習(xí)的本質(zhì)。

人類的“頓悟式學(xué)習(xí)”看似神秘，但這項(xiàng)研究告訴我們，它背后是一套極其高效的神經(jīng)計(jì)算機(jī)制：

HLVC的快速可塑性。
感知空間的結(jié)構(gòu)化先驗(yàn)。
自頂向下的反饋調(diào)控。
低層視覺區(qū)域的動態(tài)重構(gòu)。

這不是魔法，而是進(jìn)化出的高效視覺算法。

更重要的是，這項(xiàng)研究不僅解釋了人類的機(jī)制，還為 AI 指出了未來的方向。

如果未來的 AI 想要擺脫“數(shù)據(jù)饑渴”和“訓(xùn)練依賴”，真正做到“看一次就會”，它需要能快速寫入的高層表征、能實(shí)時(shí)調(diào)控的反饋機(jī)制，能在感知空間中構(gòu)建結(jié)構(gòu)化先驗(yàn)。

這將是從“深度學(xué)習(xí)”邁向“深度理解”的關(guān)鍵一步。

而這項(xiàng)研究正是這條道路上的重要里程碑。（END）

參考資料：https://www.nature.com/articles/s41467-026-68711-x

關(guān)于波動智能——

波動智能旨在建立一個(gè)基于人類意圖與反應(yīng)的真實(shí)需求洞察及滿足的價(jià)值體系，融合人工智能與意識科學(xué)，構(gòu)建覆蓋情緒識別、建模與推薦的智能引擎，自主研發(fā)面向社交、電商等場景的多模態(tài)意圖識別引擎、意圖標(biāo)簽系統(tǒng)及意圖智能推薦算法，形成從情緒采集、意圖建模到商業(yè)轉(zhuǎn)化的完整解決方案。波動智能提出“意圖是連接人、物與內(nèi)容的新型接口”，其產(chǎn)品廣泛應(yīng)用于AI社交、個(gè)性化內(nèi)容推薦、虛擬陪伴、電商體驗(yàn)優(yōu)化等領(lǐng)域。波動智能正在探索“EMO-as-a-Service”技術(shù)服務(wù)架構(gòu)，賦能企業(yè)實(shí)現(xiàn)更高效的用戶洞察與精準(zhǔn)情緒交互，推動從功能驅(qū)動到意圖驅(qū)動的產(chǎn)業(yè)范式升級。

親愛的人工智能研究者，為了確保您不會錯過*波動智能*的最新推送，請星標(biāo)*波動智能*。我們傾心打造并精選每篇內(nèi)容，只為為您帶來啟發(fā)和深思，希望能成為您理性思考路上的伙伴！

加入AI交流群請掃碼加微信

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.