<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      李飛飛李曼玲團隊發(fā)布空間理論:AI的空間智能還在三歲小孩階段

      0
      分享至

      1983 年,心理學家設(shè)計了一個簡單實驗:Sally 把彈珠放進籃子然后離開,Anne 趁她不注意把彈珠挪到盒子里。問題是,Sally 回來后,會去哪里找彈珠?

      四歲孩子能答對:去籃子,因為 Sally 不知道彈珠被移走了。三歲以下的孩子會答錯,他們分不清“自己知道”和“別人知道”的區(qū)別。這就是發(fā)展心理學里著名的 Sally-Anne 測試,它標定了人類認知發(fā)展的一道重要分水嶺。這種能力被稱為“心智理論”(Theory of Mind)。


      (動圖來源:受訪者)

      四十多年后,美國斯坦福大學李飛飛教授和美國西北大學李曼玲教授團隊把這個實驗搬到了 AI 面前,只不過這次考察的是物理世界。他們設(shè)計了一套叫“空間理論”(Theory of Space)的評估框架,目的是想弄清楚一件事:當大模型必須自己去探索、去發(fā)現(xiàn)、去拼湊信息時,它的空間智能究竟進化到了哪一級?


      圖 | 從左到右:李飛飛、李曼玲(來源:資料圖)

      從被動答題到主動探索,AI 掉了好幾個臺階

      傳統(tǒng)測試 AI 空間能力的方式,有點像開卷考試。給一張圖,問里面物體的位置關(guān)系,模型答對了就算過關(guān)。前沿模型在這種測試里得分都不錯,讓人以為它們已經(jīng)挺懂空間了。

      但李飛飛和李曼玲團隊覺得這還不夠。真實世界不是開卷考,沒有人會把所有信息一次性擺在你面前。你推開一扇門只看到客廳一角,走過走廊瞥見臥室一角,要理解整個房子的布局,你得把這些碎片拼起來,還得知道自己還有什么沒看到,下一步該往哪看。

      研究中,他們設(shè)計了一套測試環(huán)境,有文本版和視覺版兩種,讓模型在多個房間里主動探索,收集信息,構(gòu)建腦海中的認知地圖。過去評估只看最終答對答錯,這篇工作第一次能給 AI 大腦拍 X 光,他們讓模型顯式探測這張認知地圖,在每個時間步輸出自己認為物體都在什么位置。


      (動圖來源:受訪者)

      結(jié)果發(fā)現(xiàn),模型在被動模式下表現(xiàn)尚可,一旦切換到主動探索模式,性能應(yīng)聲而落。以視覺世界為例,GPT-5.2 從 57.1% 掉到 46.0%,Gemini-3 Pro 從 60.5% 掉到 57.3%,而這就是他們所說的主動被動差距。


      (來源:https://theory-of-space.github.io/paper/Theory_of_S)

      差距從哪來?他們用一套精細的診斷工具來逐層拆解模型的認知過程。

      第一個問題是效率低。規(guī)則代理平均 9 步就能覆蓋整個環(huán)境,基礎(chǔ)模型往往需要 14 步以上,而且覆蓋率更低。GPT-5.2 有個毛病,一看到門就沖過去,經(jīng)常忘了把當前房間看完。Gemini-3 Pro 好一些,會先原地旋轉(zhuǎn)觀察再移動,但也沒有規(guī)則代理高效。

      第二個問題更致命。他們設(shè)計了一個錯誤信念測試,在模型完成初次探索后,悄悄移動或旋轉(zhuǎn)幾個物體。當模型再次經(jīng)過并直接觀察到新布局時,一個令人不安的現(xiàn)象出現(xiàn)了:GPT-5.2 在視覺世界中的朝向慣性高達 68.9%,即近七成的情況下仍然堅持報告物體的舊朝向。同一模型在文本世界中慣性只有 5.5%。


      (來源:https://theory-of-space.github.io/paper/Theory_of_S)

      其實這就是信念慣性,模型親眼看到變化,但內(nèi)部表征缺乏足夠的可塑性來完成舊信念到新信念的覆寫,也就是它無法更新自己的認知。這和 Sally-Anne 測試里三歲幼兒的失敗何其相似,只不過幼兒失敗是因為認知能力尚未發(fā)育,模型失敗是因為內(nèi)部機制存在缺陷。

      認知地圖會漂移,視覺世界更高難

      他們還發(fā)現(xiàn)一個叫信念漂移的現(xiàn)象。那就是模型在初次觀察物體時的感知誤差雖然存在,不過還沒嚴重到影響整體判斷。真正的問題是,這份初始保真度無法在后續(xù)步驟中維持。隨著探索推進、信息增多,那些早先正確的記憶開始悄然退化,被后續(xù)步驟的錯誤更新覆蓋,或者在拼接不同房間的信息時產(chǎn)生內(nèi)部矛盾。


      (動圖來源:受訪者)

      最終認知地圖的低準確率,在很大程度上來自拼不住。模型缺乏穩(wěn)定維護長程空間信息的機制,新的觀察不僅沒有鞏固已有認知,反而在不斷侵蝕它。這個特點可能人類也存在,比如筆者曾去參觀故宮,一個宮殿接一個地觀看,而這些宮殿又很相似,那么就很有可能看了下一個、忘記了上一個。


      (來源:https://theory-of-space.github.io/paper/Theory_of_S)

      但是,這些問題在視覺世界中會被放大。人類被試在視覺世界中的準確率高達 96.4%(使用簡單工具后達 99.0%),在文本世界中是 86.7%。模型卻正好相反,文本表現(xiàn)遠好于視覺。視覺信息對人類而言是天然、直覺的空間認知通道,而當前多模態(tài)模型尚未學會從像素中高效提取空間結(jié)構(gòu)。

      尤其是物體朝向識別,模型幾乎接近隨機猜測。這解釋了為什么它們在視角推理任務(wù)(如 Perspective Taking)上得分慘淡,大約只有 36% 的準確率。

      而這套評估框架的價值,在于它把空間智能從會不會答這道題的二元判定,變成了一個可以逐級診斷的連續(xù)過程。它告訴我們的不只是模型還差多遠,更是它具體在哪一級開始失靈。

      如果模型連“記住剛才看到的沙發(fā)在哪”都做不到,那指望它在一個真實環(huán)境里主動導航,比如在災區(qū)搜救中定位幸存者,還有很長的路要走。


      (來源:https://theory-of-space.github.io/paper/Theory_of_S)

      目前,相關(guān)論文已被機器學習頂級會議 ICLR 2026 接收。論文、代碼和數(shù)據(jù)集都已開源。該研究由西北大學、斯坦福大學、華盛頓大學與康奈爾大學聯(lián)合完成。研究團隊里集齊了多位《麻省理工科技評論》“35 歲以下科技創(chuàng)新 35 人”的入選者,李曼玲教授是 2025 年全球入選者,美國斯坦福大學的吳佳俊教授和美國華盛頓大學的 Ranjay Krishna 教授分別入選了 2024 與 2025 年度亞太區(qū)名單。

      參考資料:

      相關(guān)論文 https://theory-of-space.github.io/paper/Theory_of_Space.pdf

      https://limanling.github.io/

      https://profiles.stanford.edu/fei-fei-li

      運營/排版:何晨龍

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      開拓者VS馬刺傷情報告出爐,文班亞馬季后賽首秀,楊瀚森有望登場

      開拓者VS馬刺傷情報告出爐,文班亞馬季后賽首秀,楊瀚森有望登場

      世界體育圈
      2026-04-19 20:16:28
      “換心”真相大白!向太曝更多內(nèi)幕,李連杰一夜回春秘密被揭開

      “換心”真相大白!向太曝更多內(nèi)幕,李連杰一夜回春秘密被揭開

      楓塵余往逝
      2026-03-27 15:35:07
      會稽山“以投入換增長”:三年花掉5.1億廣告費,爽酒成億級大單品,但仍困于江浙滬

      會稽山“以投入換增長”:三年花掉5.1億廣告費,爽酒成億級大單品,但仍困于江浙滬

      紅星新聞
      2026-04-19 20:21:16
      虛報77億、9.6億投資憑空造,河南:堅決整改 追責問責

      虛報77億、9.6億投資憑空造,河南:堅決整改 追責問責

      新京報
      2026-04-19 17:01:05
      人民日報:已投放500萬輛!新國標電動車為何突然反轉(zhuǎn),有3大原因

      人民日報:已投放500萬輛!新國標電動車為何突然反轉(zhuǎn),有3大原因

      電動車的那些事兒
      2026-04-18 07:37:58
      伊朗宣布關(guān)閉霍爾木茲海峽

      伊朗宣布關(guān)閉霍爾木茲海峽

      財聯(lián)社
      2026-04-19 02:25:05
      上海印發(fā)媒介白紋伊蚊預防控制指南,這種蚊子為何被重視?

      上海印發(fā)媒介白紋伊蚊預防控制指南,這種蚊子為何被重視?

      澎湃新聞
      2026-04-17 16:12:26
      英超德比2-1:兩人重傷+火爆沖突+100分鐘絕殺 10.2億豪門坐穩(wěn)前5

      英超德比2-1:兩人重傷+火爆沖突+100分鐘絕殺 10.2億豪門坐穩(wěn)前5

      狍子歪解體壇
      2026-04-19 23:07:25
      驚天大逆轉(zhuǎn)!中國國運爆發(fā),百年機遇降臨,西方要慌了!

      驚天大逆轉(zhuǎn)!中國國運爆發(fā),百年機遇降臨,西方要慌了!

      墜入二次元的海洋
      2026-04-19 18:09:47
      定居美國13年回國撈金遭驅(qū)逐,52歲活成笑話

      定居美國13年回國撈金遭驅(qū)逐,52歲活成笑話

      絢麗的畫卷
      2026-02-22 21:36:26
      白鹿沒想到!和張凌赫的戀情剛曝,他就被鄭麗文帶火了

      白鹿沒想到!和張凌赫的戀情剛曝,他就被鄭麗文帶火了

      觀察鑒娛
      2026-04-19 16:15:19
      英國小妹歧視中國人后續(xù):身份曝光社死,被告學校,下場大快人心

      英國小妹歧視中國人后續(xù):身份曝光社死,被告學校,下場大快人心

      米果說識
      2026-04-19 16:40:24
      日本艦自嗨后挨耳光:你討耳光我軍過航橫當水道就給你耳光!

      日本艦自嗨后挨耳光:你討耳光我軍過航橫當水道就給你耳光!

      南宗歷史
      2026-04-20 03:13:31
      扎心!一季度觀影人次銳減6700萬,票房腰斬,網(wǎng)友:電影真的難看

      扎心!一季度觀影人次銳減6700萬,票房腰斬,網(wǎng)友:電影真的難看

      火山詩話
      2026-04-17 14:17:56
      6個家庭天塌了!成都面包車追尾致6死5傷,原因公布,真相太氣人

      6個家庭天塌了!成都面包車追尾致6死5傷,原因公布,真相太氣人

      奇思妙想草葉君
      2026-04-18 23:52:46
      首次!暴力抗法,拼多多被重罰15億!

      首次!暴力抗法,拼多多被重罰15億!

      新浪財經(jīng)
      2026-04-18 13:08:25
      欠他們一句道歉!5位被毀掉的外援:瞎眼、欠薪、斷腿,巔峰全廢

      欠他們一句道歉!5位被毀掉的外援:瞎眼、欠薪、斷腿,巔峰全廢

      圣西羅的太陽
      2026-04-19 10:08:28
      我國摧毀特大假酒網(wǎng)絡(luò):查獲近2萬箱、涉案2.6億元,多在直播間銷售

      我國摧毀特大假酒網(wǎng)絡(luò):查獲近2萬箱、涉案2.6億元,多在直播間銷售

      金融界
      2026-04-19 14:16:10
      李想把“理想平替”喂成了狼

      李想把“理想平替”喂成了狼

      市象
      2026-04-17 16:42:52
      “楚超”首輪高能復盤!十七路兵馬整活不斷,“全省干武漢,武漢首戰(zhàn)告捷”

      “楚超”首輪高能復盤!十七路兵馬整活不斷,“全省干武漢,武漢首戰(zhàn)告捷”

      極目新聞
      2026-04-19 22:39:27
      2026-04-20 06:43:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16598文章數(shù) 514891關(guān)注度
      往期回顧 全部

      科技要聞

      50分26秒破人類紀錄!300臺機器人狂飆半馬

      頭條要聞

      半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

      頭條要聞

      半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

      體育要聞

      湖人1比0火箭:老詹比烏度卡像教練

      娛樂要聞

      何潤東漲粉百萬!內(nèi)娛隔空掀桌第一人

      財經(jīng)要聞

      華誼兄弟,8年虧光85億

      汽車要聞

      29分鐘大定破萬 極氪8X為什么這么多人買?

      態(tài)度原創(chuàng)

      藝術(shù)
      房產(chǎn)
      旅游
      公開課
      軍事航空

      藝術(shù)要聞

      蒲華寫水仙,清健嫵媚

      房產(chǎn)要聞

      官宣簽約最強城更!海口樓市,突然殺入神秘房企!

      旅游要聞

      小浪底庫區(qū)南北兩岸游線通航

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗逼退美掃雷艇:美方求給15分鐘撤退

      無障礙瀏覽 進入關(guān)懷版