<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      Nature 重磅發(fā)布:人類一眼頓悟的 one-shot 學(xué)習(xí)機(jī)制,可能是AI 的下一次范式革命

      0
      分享至

      如果你曾看過那張著名的“達(dá)爾馬提亞狗圖”,你大概體驗(yàn)過一種奇妙的瞬間。第一眼,你只看到一團(tuán)混亂的黑白斑點(diǎn),第二眼,當(dāng)有人告訴你“這是只狗”,你的視覺系統(tǒng)仿佛被點(diǎn)亮,從此再也無法“看不見那只狗”。

      科學(xué)家把這種現(xiàn)象稱為單次感知學(xué)習(xí)(one-shot perceptual learning)。 它的神奇之處在于只需要一次清晰圖像的呈現(xiàn),就能永久改變你對退化圖像的感知方式

      在實(shí)驗(yàn)室里,這種現(xiàn)象常用“Mooney 圖”來研究——一種極度退化、幾乎無法識別的黑白圖像。 但只要你看過一次對應(yīng)的清晰原圖,再回頭看 Mooney 圖,你會驚訝地發(fā)現(xiàn)它突然變得“顯而易見”

      這種“頓悟式學(xué)習(xí)”與我們熟悉的“練習(xí)成就完美”完全不同。

      傳統(tǒng)的視覺學(xué)習(xí)需要成百上千次重復(fù)訓(xùn)練,像肌肉記憶一樣慢慢積累; 而 one-shot 學(xué)習(xí)更像是大腦的“閃存寫入”,一次寫入,永久生效。

      然而,現(xiàn)代 AI 雖然在圖像識別上已經(jīng)強(qiáng)到離譜,卻依然難以復(fù)現(xiàn)這種能力。 深度學(xué)習(xí)模型需要海量數(shù)據(jù)、長時(shí)間訓(xùn)練、巨量算力,才能學(xué)會識別一個(gè)新類別。

      相比之下,人類只需要一次體驗(yàn)

      這背后到底發(fā)生了什么? 大腦是如何做到一次寫入、長期保持、不遺忘舊知識,不破壞已有視覺系統(tǒng),還能在毫秒級時(shí)間內(nèi)調(diào)用這些先驗(yàn)?

      更關(guān)鍵的是這種快速學(xué)習(xí)到底發(fā)生在大腦的哪個(gè)區(qū)域?先驗(yàn)知識以什么格式存儲?是概念?是形狀?還是某種抽象的視覺模板?神經(jīng)機(jī)制如何避免“災(zāi)難性遺忘”,而深度學(xué)習(xí)模型卻做不到?我們能否構(gòu)建一個(gè)真正具備人類式one-shot學(xué)習(xí)能力的AI?


      圖1 |心理物理學(xué)實(shí)驗(yàn)的范式和假設(shè)。

      這些問題長期以來懸而未決。直到這篇《Neural and computational mechanisms underlying one-shot perceptual learning in humans》發(fā)表在Nature Communications的研究出現(xiàn)。

      這項(xiàng)研究由紐約大學(xué)(NYU)和 Mount Sinai 醫(yī)學(xué)院的跨學(xué)科團(tuán)隊(duì)聯(lián)合完成,成員橫跨認(rèn)知神經(jīng)科學(xué)、視覺神經(jīng)科學(xué)、臨床神經(jīng)外科(提供 iEEG 數(shù)據(jù))、生物醫(yī)學(xué)工程、計(jì)算機(jī)工程、數(shù)據(jù)科學(xué)與深度學(xué)習(xí)。

      團(tuán)隊(duì)由 Biyu J. He與 Eric Oermann 共同領(lǐng)導(dǎo),他們在視覺認(rèn)知、神經(jīng)電生理和醫(yī)學(xué) AI 領(lǐng)域都處于國際前沿。

      這項(xiàng)研究的意義在于它不僅回答了“人類如何做到 one-shot 學(xué)習(xí)”這一神經(jīng)科學(xué)難題,還首次構(gòu)建了一個(gè)能模擬人類單次感知學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)模型,并將其與人腦的神經(jīng)編碼進(jìn)行對齊。

      01研究設(shè)計(jì):三條證據(jù)鏈鎖定大腦中的“先驗(yàn)存儲器”

      為了破解 one-shot 感知學(xué)習(xí)的神經(jīng)與計(jì)算機(jī)制,研究團(tuán)隊(duì)設(shè)計(jì)了一套極其嚴(yán)謹(jǐn)、跨層級的研究方案。 他們沒有依賴單一實(shí)驗(yàn),而是從行為、神經(jīng)表征、時(shí)間動態(tài)和計(jì)算模型四個(gè)維度同時(shí)出擊,構(gòu)建了一條“閉環(huán)式證據(jù)鏈”。

      這套設(shè)計(jì)可以概括為一句話:從行為推斷先驗(yàn)結(jié)構(gòu),從神經(jīng)定位存儲區(qū)域,從時(shí)間確定激活順序,再用模型復(fù)現(xiàn)機(jī)制

      整個(gè)研究包含四條互補(bǔ)證據(jù)鏈。

      首先是行為層面。研究者通過操控清晰圖像的方向、大小、位置、類別等屬性,觀察這些操控是否會破壞 one-shot 學(xué)習(xí)。 如果某種操控不影響學(xué)習(xí),就說明大腦中的“先驗(yàn)知識”對該屬性具有不變性; 反之,則說明先驗(yàn)依賴該屬性。 通過這種方式,他們繪制出一張“先驗(yàn)不變性地圖”,從行為層面推斷先驗(yàn)可能存儲在哪個(gè)腦區(qū)。

      接著是神經(jīng)層面。研究者使用 7T fMRI 測量不同腦區(qū)對這些操控的神經(jīng)表征差異。 如果某個(gè)腦區(qū)的神經(jīng)表征不變性結(jié)構(gòu)與行為不變性結(jié)構(gòu)一致,就說明它可能是先驗(yàn)的存儲地。 這一步是行為推斷的神經(jīng)驗(yàn)證。

      然后是時(shí)間維度。通過對癲癇患者的顱內(nèi)電記錄(iEEG),研究者測量不同腦區(qū)在學(xué)習(xí)后對 Mooney 圖的反應(yīng)變化。 先驗(yàn)存儲區(qū)應(yīng)該是最早出現(xiàn)學(xué)習(xí)效應(yīng)的區(qū)域。 這一步提供了時(shí)間因果證據(jù)。

      最后是計(jì)算層面。 研究團(tuán)隊(duì)構(gòu)建了一個(gè)具備 one-shot 學(xué)習(xí)能力的深度神經(jīng)網(wǎng)絡(luò)模型,并將模型中學(xué)到的“先驗(yàn)”與人腦不同腦區(qū)的神經(jīng)編碼進(jìn)行對齊。 如果模型先驗(yàn)與某個(gè)腦區(qū)的神經(jīng)表征最相似,就進(jìn)一步支持該腦區(qū)是人類先驗(yàn)的存儲地。

      這四條證據(jù)鏈最終指向同一個(gè)答案:高層視覺皮層(HLVC)是人類one-shot感知學(xué)習(xí)的核心存儲器

      02心理物理學(xué):先驗(yàn)知識的“不變性地圖”揭示其存儲位置

      如果說 one-shot 感知學(xué)習(xí)是一種“頓悟”,那么心理物理學(xué)實(shí)驗(yàn)就是在拆解這場頓悟背后的“視覺魔術(shù)”。研究團(tuán)隊(duì)從最基礎(chǔ)的行為層面入手,試圖回答一個(gè)看似簡單卻極其關(guān)鍵的問題——大腦到底存了一個(gè)什么樣的“先驗(yàn)?zāi)0濉保屛覀冊诳催^一次清晰圖像后就能永遠(yuǎn)識別那張退化圖?

      為了回答這個(gè)問題,他們設(shè)計(jì)了一套極其巧妙的實(shí)驗(yàn)范式。


      圖2|映射感知先驗(yàn)的不變性屬性。

      Mooney圖:為什么它難得離譜?

      Mooney 圖是一種極端退化的黑白圖像,幾乎沒有灰度、沒有邊緣、沒有紋理,只有大片黑白塊。 對視覺系統(tǒng)來說,這就像把一段旋律只留下節(jié)奏、去掉音高——信息少得可憐。

      所以第一次看到 Mooney 圖時(shí),你的大腦幾乎無法從中提取任何結(jié)構(gòu)。 但只要你看過一次對應(yīng)的清晰原圖,再回頭看 Mooney 圖,你會突然發(fā)現(xiàn):

      “啊,這不就是一只狗/一個(gè)人/一輛車嗎?”

      這種“瞬間開竅”的體驗(yàn),就是單次感知學(xué)習(xí)的核心。

      單次呈現(xiàn)清晰圖像如何瞬間改變感知?

      研究者讓受試者先看 Mooney 圖(通常認(rèn)不出來), 然后只呈現(xiàn)一次對應(yīng)的清晰圖像, 再讓他們看同一張Mooney 圖。

      結(jié)果幾乎所有人都能立刻認(rèn)出圖像內(nèi)容,而且這種效果能持續(xù)數(shù)月。

      這說明大腦在一次呈現(xiàn)中就寫入了某種“先驗(yàn)知識”。 但這個(gè)先驗(yàn)到底是什么? 是形狀?是輪廓?是空間布局?還是某種抽象的視覺模板?

      為了回答這個(gè)問題,研究團(tuán)隊(duì)開始“折磨”清晰圖像。

      操控清晰圖像:方向、大小、位置,一項(xiàng)項(xiàng)試過去

      研究者的邏輯非常直接,如果改變某個(gè)屬性后學(xué)習(xí)效果不變,說明大腦的先驗(yàn)對這個(gè)屬性“不敏感”。反之,則說明先驗(yàn)依賴這個(gè)屬性

      這就像在測試一個(gè)鎖的密碼: 你改動某一位數(shù)字,鎖還能打開,那這一位就不是關(guān)鍵位。

      于是他們對清晰圖像做了三類操控。

      方向變化:翻轉(zhuǎn)、旋轉(zhuǎn)——學(xué)習(xí)變?nèi)醯粫?/p>

      當(dāng)清晰圖像被左右翻轉(zhuǎn)或旋轉(zhuǎn) 90°后,受試者的學(xué)習(xí)效果明顯下降,但并沒有完全消失。

      這意味著大腦的先驗(yàn)對方向部分不變,但方向仍然是先驗(yàn)的一部分。

      這種“部分不變性”非常像高層視覺皮層(HLVC)的編碼特征: 它對方向有一定不變性,但不是完全不變。

      大小變化:6°、12°、24°——完全不影響學(xué)習(xí)

      這是最關(guān)鍵的發(fā)現(xiàn)之一。

      無論清晰圖像縮小一半還是放大一倍,學(xué)習(xí)效果都幾乎不變。

      這直接排除了早期視覺皮層(V1–V4)作為先驗(yàn)存儲區(qū)的可能性,因?yàn)檫@些區(qū)域?qū)Υ笮O其敏感,圖像大小變化會徹底改變它們的神經(jīng)編碼。

      而高層視覺皮層(尤其 IT 區(qū))對大小高度不變。

      這是一條非常強(qiáng)的證據(jù)。

      位置變化:偏移 6°——學(xué)習(xí)變?nèi)醯幌?/p>

      當(dāng)清晰圖像被移到左側(cè)或右側(cè) 6°時(shí),學(xué)習(xí)效果下降,但依然存在。

      這再次呈現(xiàn)出“部分不變性”的特征。

      結(jié)合方向與大小的結(jié)果,一個(gè)清晰的模式浮現(xiàn)出來:

      • 大小:完全不變

      • 方向:部分不變

      • 位置:部分不變

      這正是高層視覺皮層(HLVC)的典型編碼特征。

      概念 vs 感知:換成同類不同 exemplar → 學(xué)習(xí)直接消失

      研究者做了一個(gè)非常關(guān)鍵的操控,把清晰圖像換成同一類別的另一張圖。

      比如 Mooney 圖對應(yīng)的是一只特定姿態(tài)的貓, 但清晰圖像換成另一只貓。

      結(jié)果學(xué)習(xí)效果直接消失。

      這說明大腦存儲的先驗(yàn)不是“貓”這個(gè)概念,而是“這張貓圖的具體視覺結(jié)構(gòu)”。

      換句話說,先驗(yàn)存儲在感知空間而不是概念空間

      這與 IT 區(qū)的神經(jīng)編碼完全一致, IT 區(qū)雖然能區(qū)分類別,但它的編碼本質(zhì)上仍是具體視覺特征的顯式表示

      M通路vs P通路:兩條通路都能誘發(fā)學(xué)習(xí)

      研究者還測試了低對比度(偏向 M 通路)、紅綠等亮度(偏向 P 通路),

      結(jié)果兩者都能誘發(fā)學(xué)習(xí)。

      這說明先驗(yàn)不依賴某一條視覺通路,但兩條通路都能投射到 IT 區(qū),再次指向 HLVC 作為先驗(yàn)存儲區(qū)。

      至此,行為層面的證據(jù)已經(jīng)非常清晰,先驗(yàn)的“不變性結(jié)構(gòu)”與高層視覺皮層的編碼特性高度一致

      03HLVC的神經(jīng)表征與行為先驗(yàn)完全一致

      行為實(shí)驗(yàn)告訴我們先驗(yàn)長什么樣, 但 fMRI 能告訴我們大腦哪里真的以這種方式編碼圖像

      研究團(tuán)隊(duì)使用 7T 超高場 fMRI,對每張圖像在不同操控條件下的神經(jīng)表征進(jìn)行建模。

      構(gòu)建神經(jīng) RDM:70×70的圖像-條件矩陣

      他們選取了 10 張圖像 × 7 種操控條件, 構(gòu)建了一個(gè) 70×70 的神經(jīng)表征距離矩陣(RDM)。

      每個(gè)元素代表:

      “圖 A 在條件 X 與圖 B 在條件 Y 的神經(jīng)表征差異有多大?”

      這是表征相似性分析(RSA)的核心。


      圖3 |基于模型的RSA結(jié)果(n=10名受試者)。

      哪些腦區(qū)具有“操控不變性”?

      研究者把不同腦區(qū)的神經(jīng) RDM拿來對比,結(jié)果非常有意思。

      • HLVC(LO1、LO2、FC): 對方向、大小、位置操控表現(xiàn)出顯著不變性 與行為結(jié)果高度一致。

      • V4:有部分不變性,但不完全匹配。

      • EVC(V1–V3):完全不匹配(對大小極其敏感)。

      • FPN、DMN: 雖然任務(wù)中活躍,但不具備這種不變性結(jié)構(gòu)。

      只有 HLVC 的神經(jīng)表征與行為推斷的“先驗(yàn)結(jié)構(gòu)”一致。

      模型 RDM vs 神經(jīng)RDM:最終對齊

      研究者基于行為實(shí)驗(yàn)構(gòu)建了一個(gè)“先驗(yàn)?zāi)P?RDM”,包含三種距離等級:

      • 大小變化:低距離。

      • 方向/位置變化:中距離。

      • 不同 exemplar:高距離。

      然后與各腦區(qū)的神經(jīng) RDM 進(jìn)行相關(guān)分析。

      結(jié)果只有一個(gè)腦區(qū)顯著相關(guān):HLVC(尤其LO2和FC)

      這意味著HLVC是最可能的先驗(yàn)存儲部位

      04顱內(nèi)電記錄(iEEG):HLVC 最早出現(xiàn)學(xué)習(xí)效應(yīng)

      如果說心理物理學(xué)告訴我們“先驗(yàn)長什么樣”,fMRI 告訴我們“先驗(yàn)存在哪里”,那么顱內(nèi)電記錄(iEEG)則回答了一個(gè)更尖銳的問題:誰是最先被先驗(yàn)點(diǎn)亮的腦區(qū)?

      這是一個(gè)時(shí)間維度的問題,而時(shí)間,往往是因果的關(guān)鍵。


      圖4|學(xué)習(xí)誘導(dǎo)活動變化的時(shí)間特性。

      為什么時(shí)間維度重要?

      在大腦中,信息流動是有順序的。 如果某個(gè)區(qū)域真的存儲了先驗(yàn),那么當(dāng)你再次看到 Mooney 圖時(shí),它應(yīng)該是最早被激活的區(qū)域—— 就像一個(gè)熟悉的旋律響起,你腦海中最先浮現(xiàn)的那段記憶,必然是它的“源頭”。

      先驗(yàn)存儲區(qū)必須在視覺輸入到達(dá)后最先發(fā)生變化,而不是等別人告訴它“該怎么想”

      這就是 iEEG 的價(jià)值所在。 它不像 fMRI 那樣“慢吞吞”,而是毫秒級的神經(jīng)電信號,能精確捕捉大腦中哪一塊皮層最先“覺醒”。

      HLVC在~150 ms出現(xiàn)學(xué)習(xí)效應(yīng)

      研究團(tuán)隊(duì)在癲癇患者中記錄了顱內(nèi)電信號,比較學(xué)習(xí)前后 Mooney 圖觸發(fā)的神經(jīng)反應(yīng)。

      結(jié)果非常干脆:

      高層視覺皮層(HLVC)在大約150毫秒時(shí)就出現(xiàn)了顯著的學(xué)習(xí)效應(yīng)

      這意味HLVC 在看到退化圖像時(shí),會迅速調(diào)用剛剛寫入的先驗(yàn),并在極短時(shí)間內(nèi)改變對圖像的解釋方式。

      這不是“被動響應(yīng)”,而是“主動調(diào)控”。

      FPN、DMN的變化更晚出現(xiàn)

      相比之下,前額-頂葉網(wǎng)絡(luò)(FPN)和默認(rèn)模式網(wǎng)絡(luò)(DMN)雖然也會在學(xué)習(xí)后表現(xiàn)出變化,但時(shí)間明顯滯后。

      這說明它們可能參與注意、解釋、決策等高階過程,但不是先驗(yàn)的存儲者,更像是“接收來自 HLVC 的更新信息”。

      這條時(shí)間因果證據(jù)與行為和 fMRI 的空間證據(jù)完美對齊:

      HLVC是先驗(yàn)的源頭,而不是被動接收者

      05深度神經(jīng)網(wǎng)絡(luò)模型:構(gòu)建一個(gè)能“一眼頓悟”的 AI

      科學(xué)研究最迷人的地方在于它不僅解釋世界,還能啟發(fā)我們構(gòu)建新的系統(tǒng)。

      當(dāng)研究團(tuán)隊(duì)已經(jīng)用行為、fMRI、iEEG 三條證據(jù)鏈鎖定HLVC 后,他們做了一件更大膽的事——構(gòu)建一個(gè)能像人類一樣進(jìn)行one-shot感知學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò)

      這不是“再訓(xùn)練一下模型”那么簡單,而是一次對AI 學(xué)習(xí)機(jī)制的重新設(shè)計(jì)。


      圖5 |模型顯示了感知學(xué)習(xí)效果并預(yù)測了人類的學(xué)習(xí)結(jié)果。

      模型架構(gòu):Vision Transformer + Top-down Feedback

      研究團(tuán)隊(duì)以 Vision Transformer(ViT)為基礎(chǔ),但加入了一個(gè)關(guān)鍵機(jī)制:自頂向下反饋(Top-down Feedback)

      這一步非常關(guān)鍵,因?yàn)槿四X的視覺系統(tǒng)不是單向的,高層視覺區(qū)域會不斷向低層區(qū)域發(fā)送反饋,這種反饋是“先驗(yàn)注入”的核心機(jī)制。

      傳統(tǒng)的深度學(xué)習(xí)模型幾乎都是“自下而上”的,缺乏這種動態(tài)調(diào)控能力。 而加入反饋后,模型可以在一次呈現(xiàn)清晰圖像后,更新內(nèi)部先驗(yàn),在下一次看到 Mooney 圖時(shí),用先驗(yàn)去“修正”對退化圖像的解釋。

      這就是人工系統(tǒng)中的“頓悟”。

      模型結(jié)果:AI 真的學(xué)會了“一眼頓悟”

      令人驚喜的是,這個(gè)模型不僅能進(jìn)行 one-shot 學(xué)習(xí),而且表現(xiàn)得非常“人類”。

      研究團(tuán)隊(duì)發(fā)現(xiàn)模型成功復(fù)現(xiàn)了人類的整體學(xué)習(xí)幅度

      也就是說看一次清晰圖像,模型對 Mooney 圖的識別率顯著提升,幅度與人類非常接近。

      更令人震驚的是模型能預(yù)測不同圖像的學(xué)習(xí)難度差異(image-specific)

      或者說哪些 Mooney 圖更容易被人類“頓悟”,哪些更難,模型都能提前預(yù)測。

      這說明模型不僅學(xué)到了“先驗(yàn)”,還學(xué)到了“先驗(yàn)的結(jié)構(gòu)”。

      模型學(xué)到的“先驗(yàn)”與 HLVC 神經(jīng)編碼最相似

      研究團(tuán)隊(duì)進(jìn)一步把模型內(nèi)部的“先驗(yàn)表征”與人腦不同區(qū)域的神經(jīng)編碼進(jìn)行對齊。

      結(jié)果再次指向同一個(gè)答案,模型的先驗(yàn)與HLVC的神經(jīng)編碼最相似

      這意味著模型學(xué)到的不是“概念標(biāo)簽”,而是類似 HLVC 的“結(jié)構(gòu)化感知模板”,這種模板具有與人類相同的不變性結(jié)構(gòu)。

      這不僅驗(yàn)證了模型的合理性,也驗(yàn)證了人腦的機(jī)制。

      計(jì)算模型與人腦在先驗(yàn)格式上高度一致

      四條證據(jù)鏈——行為、fMRI、iEEG、模型——最終收斂到一個(gè)令人信服的結(jié)論:

      人類的one-shot感知學(xué)習(xí)依賴HLVC的快速可塑性與自頂向下反饋機(jī)制。而一個(gè)具備類似結(jié)構(gòu)的深度模型,也能實(shí)現(xiàn)“一眼頓悟”。

      這不僅是神經(jīng)科學(xué)的突破,也是 AI 的啟示。

      未來的快速學(xué)習(xí)模型,可能不再依賴海量數(shù)據(jù)和反復(fù)訓(xùn)練,而是依賴高層表征的快速寫入,自頂向下的動態(tài)調(diào)控,感知空間的結(jié)構(gòu)化先驗(yàn)。

      AI要想更像人類,就必須學(xué)會“用先驗(yàn)看世界”。

      06人類 one-shot 感知學(xué)習(xí)的神經(jīng)與計(jì)算機(jī)制

      當(dāng)我們把心理物理學(xué)的不變性地圖、7T fMRI 的空間表征、iEEG 的時(shí)間因果證據(jù),以及深度神經(jīng)網(wǎng)絡(luò)的計(jì)算模擬放在一起時(shí),一個(gè)極其清晰、幾乎無可辯駁的圖景浮現(xiàn)出來,人類的單次感知學(xué)習(xí)并不是魔法,而是一套高度結(jié)構(gòu)化、層級分明、效率驚人的神經(jīng)計(jì)算機(jī)制。

      這套機(jī)制的核心,就是高層視覺皮層(HLVC)。

      先驗(yàn)存儲在 HLVC,而非海馬體或前額葉

      長期以來,很多人以為“快速學(xué)習(xí) = 海馬體”,因?yàn)?episodic memory(情景記憶)確實(shí)依賴海馬體,并且也是“看一次就記住”。 但這項(xiàng)研究用行為學(xué)和神經(jīng)證據(jù)明確告訴我們:one-shot感知學(xué)習(xí)≠ episodic memory。

      海馬體負(fù)責(zé)的是“你見過這張圖嗎?” HLVC 負(fù)責(zé)的是“你能看懂這張圖嗎?”

      這兩者是完全不同的任務(wù)。

      前額葉和頂葉網(wǎng)絡(luò)雖然在任務(wù)中活躍,但它們更像是“調(diào)度中心”,而不是“存儲倉庫”。 真正寫入先驗(yàn)、真正發(fā)生可塑性的地方,是 HLVC。

      這意味著人類的快速感知學(xué)習(xí)是皮層內(nèi)學(xué)習(xí),是視覺系統(tǒng)自身的快速重構(gòu),是一種“直接寫入視覺模型”的機(jī)制,而不是“寫入記憶庫再調(diào)用”。

      這與現(xiàn)代 AI 的訓(xùn)練方式形成鮮明對比。

      先驗(yàn)格式:部分不變、感知空間、結(jié)構(gòu)化特征編碼

      研究的心理物理學(xué)部分揭示了先驗(yàn)的“格式”:

      • 對大小完全不變。

      • 對方向、位置部分不變。

      • 對 exemplar 完全敏感。

      • 存儲在感知空間,而非概念空間。

      這說明先驗(yàn)不是抽象的“類別標(biāo)簽”,不是“這是貓”,而是這張貓圖的結(jié)構(gòu)化視覺模板”。

      它包含邊緣、形狀、空間布局、局部特征的組合方式。

      這些都是 HLVC(尤其 IT 區(qū))最擅長編碼的內(nèi)容。

      先驗(yàn)是一種可直接作用于視覺處理的結(jié)構(gòu)化模板,而不是語言或概念層面的知識。

      這也解釋了為什么一次呈現(xiàn)就能改變感知,你不是“學(xué)會了一個(gè)概念”,而是“更新了視覺模型本身”。


      圖6 |大腦預(yù)測對比揭示了FC在學(xué)習(xí)中的強(qiáng)烈參與。

      機(jī)制模型:HLVC → 自頂向下反饋 → 早期視覺皮層

      把所有證據(jù)整合起來,我們得到一個(gè)極其優(yōu)雅的機(jī)制模型,HLVC存儲先驗(yàn)→再次看到Mooney圖時(shí)先驗(yàn)被激活→通過反饋調(diào)節(jié)早期視覺皮層→讓退化圖像變得可識別。

      這是一種“從上往下”的視覺重建過程。

      第一次看到 Mooney 圖時(shí),早期視覺皮層只能看到混亂的黑白塊; 但當(dāng) HLVC 擁有了先驗(yàn),它會在毫秒級時(shí)間內(nèi)把“正確的解釋”反饋給低層視覺區(qū)域,讓它們重新組織輸入。

      這就是為什么Mooney 圖第一次看不懂,第二次就“突然顯而易見”,而且這種效果能持續(xù)數(shù)月。

      因?yàn)槟悴皇怯涀×藞D像,而是更新了視覺系統(tǒng)的內(nèi)部結(jié)構(gòu)。

      07從人腦到 AI 的未來啟示

      快速學(xué)習(xí)不是“微調(diào)參數(shù)”,而是“寫入先驗(yàn)”

      這項(xiàng)研究對 AI 的啟示非常深刻。

      現(xiàn)代深度學(xué)習(xí)模型的學(xué)習(xí)方式是大量樣本、大量梯度下降、大量參數(shù)更新、訓(xùn)練一次,推理一次。

      但人類的 one-shot 學(xué)習(xí)不是這樣。

      人類的快速學(xué)習(xí)依賴高層表征的快速寫入,自頂向下的動態(tài)調(diào)控感知,空間的結(jié)構(gòu)化先驗(yàn)。

      這意味著未來的 AI 想要具備真正的人類式 one-shot 學(xué)習(xí)能力,必須從“訓(xùn)練范式”轉(zhuǎn)向“結(jié)構(gòu)范式”。

      不是簡單的參數(shù)微調(diào),而是構(gòu)建一個(gè)能快速寫入高層表征、并通過反饋機(jī)制影響低層處理的系統(tǒng)。

      AI 不應(yīng)該只會“學(xué)會分類”, 而應(yīng)該學(xué)會“更新自己的視覺模型”。這才是人類式學(xué)習(xí)的本質(zhì)。

      人類的“頓悟式學(xué)習(xí)”看似神秘,但這項(xiàng)研究告訴我們,它背后是一套極其高效的神經(jīng)計(jì)算機(jī)制:

      • HLVC的快速可塑性。

      • 感知空間的結(jié)構(gòu)化先驗(yàn)。

      • 自頂向下的反饋調(diào)控。

      • 低層視覺區(qū)域的動態(tài)重構(gòu)。

      這不是魔法,而是進(jìn)化出的高效視覺算法。

      更重要的是,這項(xiàng)研究不僅解釋了人類的機(jī)制,還為 AI 指出了未來的方向。

      如果未來的 AI 想要擺脫“數(shù)據(jù)饑渴”和“訓(xùn)練依賴”,真正做到“看一次就會”,它需要能快速寫入的高層表征、能實(shí)時(shí)調(diào)控的反饋機(jī)制,能在感知空間中構(gòu)建結(jié)構(gòu)化先驗(yàn)。

      這將是從“深度學(xué)習(xí)”邁向“深度理解”的關(guān)鍵一步。

      而這項(xiàng)研究正是這條道路上的重要里程碑。(END)

      參考資料:https://www.nature.com/articles/s41467-026-68711-x


      關(guān)于波動智能——

      波動智能旨在建立一個(gè)基于人類意圖與反應(yīng)的真實(shí)需求洞察及滿足的價(jià)值體系,融合人工智能與意識科學(xué),構(gòu)建覆蓋情緒識別、建模與推薦的智能引擎,自主研發(fā)面向社交、電商等場景的多模態(tài)意圖識別引擎、意圖標(biāo)簽系統(tǒng)及意圖智能推薦算法,形成從情緒采集、意圖建模到商業(yè)轉(zhuǎn)化的完整解決方案。波動智能提出“意圖是連接人、物與內(nèi)容的新型接口”,其產(chǎn)品廣泛應(yīng)用于AI社交、個(gè)性化內(nèi)容推薦、虛擬陪伴、電商體驗(yàn)優(yōu)化等領(lǐng)域。波動智能正在探索“EMO-as-a-Service”技術(shù)服務(wù)架構(gòu),賦能企業(yè)實(shí)現(xiàn)更高效的用戶洞察與精準(zhǔn)情緒交互,推動從功能驅(qū)動到意圖驅(qū)動的產(chǎn)業(yè)范式升級。

      親愛的人工智能研究者,為了確保您不會錯過*波動智能*的最新推送,請星標(biāo)*波動智能*。我們傾心打造并精選每篇內(nèi)容,只為為您帶來啟發(fā)和深思,希望能成為您理性思考路上的伙伴!

      加入AI交流群請掃碼加微信

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      戲子誤國!春節(jié)剛過3位明星相繼塌房,事情做絕一個(gè)比一個(gè)荒唐

      戲子誤國!春節(jié)剛過3位明星相繼塌房,事情做絕一個(gè)比一個(gè)荒唐

      琨玉秋霜
      2026-03-02 06:09:04
      “最慘超女”黃雅莉:沒工作沒積蓄,34歲生子后住5平米的小屋

      “最慘超女”黃雅莉:沒工作沒積蓄,34歲生子后住5平米的小屋

      地理三體說
      2026-01-29 21:40:34
      結(jié)婚不到一年,娶了“白月光”的李國慶,口碑徹底反轉(zhuǎn)了

      結(jié)婚不到一年,娶了“白月光”的李國慶,口碑徹底反轉(zhuǎn)了

      蕭鑟科普解說
      2026-02-26 06:07:11
      這老師真是絕代美人啊!

      這老師真是絕代美人啊!

      東方不敗然多多
      2026-03-01 01:09:31
      莫迪想賭一把大的,為了把中國企業(yè)釣去印度,畫7500億大餅做魚餌

      莫迪想賭一把大的,為了把中國企業(yè)釣去印度,畫7500億大餅做魚餌

      胖福的小木屋
      2026-03-01 22:34:51
      臺積電創(chuàng)辦人張忠謀:如果想扼殺中國大陸,中國大陸真的無能為力

      臺積電創(chuàng)辦人張忠謀:如果想扼殺中國大陸,中國大陸真的無能為力

      混沌錄
      2026-02-27 21:29:05
      重磅發(fā)布!“京通”APP要來了

      重磅發(fā)布!“京通”APP要來了

      家住昌平
      2026-03-02 21:27:03
      哇塞!交易界的"盲盒"要開啦!倫納德等來全明星后衛(wèi)...

      哇塞!交易界的"盲盒"要開啦!倫納德等來全明星后衛(wèi)...

      體育新角度
      2026-03-02 23:12:57
      氫彈威力上不封頂,但核武器有個(gè)不成文的規(guī)定:扔不到對方頭上去

      氫彈威力上不封頂,但核武器有個(gè)不成文的規(guī)定:扔不到對方頭上去

      沒有偏旁的常慶
      2026-03-01 07:00:11
      70%用戶表示“失去靈魂”,全新奧迪A6L:實(shí)力很強(qiáng),口碑兩極分化

      70%用戶表示“失去靈魂”,全新奧迪A6L:實(shí)力很強(qiáng),口碑兩極分化

      少數(shù)派報(bào)告Report
      2026-03-02 11:43:10
      演員李茂已租車開往阿曼,全家將經(jīng)由阿曼乘機(jī)回國

      演員李茂已租車開往阿曼,全家將經(jīng)由阿曼乘機(jī)回國

      三湘都市報(bào)
      2026-03-02 20:33:03
      伊朗稱用導(dǎo)彈摧毀阿聯(lián)酋“薩德”系統(tǒng)

      伊朗稱用導(dǎo)彈摧毀阿聯(lián)酋“薩德”系統(tǒng)

      參考消息
      2026-03-02 11:22:12
      驚!美國設(shè)“谷愛凌法案”?!沒收全部財(cái)產(chǎn),背叛美國,必付代價(jià)

      驚!美國設(shè)“谷愛凌法案”?!沒收全部財(cái)產(chǎn),背叛美國,必付代價(jià)

      北國向錫安
      2026-03-02 16:55:11
      明星卸妝后,曾黎臉蠟黃,王子文像老阿姨,看到王一博后我驚呆了

      明星卸妝后,曾黎臉蠟黃,王子文像老阿姨,看到王一博后我驚呆了

      最美的開始
      2026-02-24 19:00:14
      伊朗1200枚導(dǎo)彈復(fù)仇,美航母遇襲,三國準(zhǔn)備下場,戰(zhàn)爭走向失控?

      伊朗1200枚導(dǎo)彈復(fù)仇,美航母遇襲,三國準(zhǔn)備下場,戰(zhàn)爭走向失控?

      紓瑤
      2026-03-02 19:11:03
      100%賴賬,這何嘗不是一種極致的誠信!

      100%賴賬,這何嘗不是一種極致的誠信!

      財(cái)經(jīng)保探長
      2026-02-28 10:46:25
      寵妾滅妻、“吸血”親爹,侄女再曝大瓜,楊議徹底活成全網(wǎng)笑話!

      寵妾滅妻、“吸血”親爹,侄女再曝大瓜,楊議徹底活成全網(wǎng)笑話!

      奇怪的鯊魚們
      2026-03-02 06:41:32
      小托馬斯狂言:杜蘭特退役必登歷史得分第二!死神真能封神?

      小托馬斯狂言:杜蘭特退役必登歷史得分第二!死神真能封神?

      林子說事
      2026-03-02 14:41:57
      因加速、倒放宣傳視頻引發(fā)爭議 兩家鴻蒙智行用戶中心公開致歉

      因加速、倒放宣傳視頻引發(fā)爭議 兩家鴻蒙智行用戶中心公開致歉

      中國能源網(wǎng)
      2026-03-02 11:47:11
      韓媒:韓國前國腳李記帝將與伊朗球隊(duì)解約,球員在大使館避難

      韓媒:韓國前國腳李記帝將與伊朗球隊(duì)解約,球員在大使館避難

      懂球帝
      2026-03-02 16:49:59
      2026-03-03 00:08:49
      人工智能學(xué)家 incentive-icons
      人工智能學(xué)家
      人工智能領(lǐng)域權(quán)威媒體
      4555文章數(shù) 37413關(guān)注度
      往期回顧 全部

      科技要聞

      蘋果中國官網(wǎng)上線iPhone 17e,4499元起

      頭條要聞

      媒體:拉里賈尼走向前臺 四大關(guān)鍵變量將決定伊朗命運(yùn)

      頭條要聞

      媒體:拉里賈尼走向前臺 四大關(guān)鍵變量將決定伊朗命運(yùn)

      體育要聞

      “想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對手主帥

      娛樂要聞

      李亞鵬與哥哥和解 只有一條真心話短信

      財(cái)經(jīng)要聞

      油價(jià)飆升 美伊沖突將如何攪動全球經(jīng)濟(jì)

      汽車要聞

      國民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

      態(tài)度原創(chuàng)

      藝術(shù)
      數(shù)碼
      游戲
      家居
      公開課

      藝術(shù)要聞

      簡約的風(fēng)景畫,美國畫家Ben Bauer作品

      數(shù)碼要聞

      英偉達(dá)發(fā)布595.71 WHQL驅(qū)動,修復(fù)顯卡風(fēng)扇“翻車”問題

      《寶可夢》新作M站90分!近年最新鮮的寶可夢體驗(yàn)

      家居要聞

      萬物互聯(lián) 享科技福祉

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版