<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      密歇根、斯坦福、Figure AI 牽頭!機器人記憶基準 RoboMME 發布

      0
      分享至

      讓機器人把指定顏色的立方體放進箱子并準確計數,在物體被遮擋后仍能追蹤其位置,重復之前演示過的動作軌跡,這些看似簡單的操作,背后都離不開"記憶"的支撐。長期以來,機器人在復雜場景下的歷史依賴型任務表現不佳,核心原因之一就是缺乏標準化的記憶能力評估體系。



      密歇根大學、斯坦福大學、Figure AI等機構聯合推出的RoboMME benchmark,首次將機器人記憶劃分為 temporal(時間)、spatial(空間)、object(物體)、procedural(程序)四大維度,通過16個細分任務和770k高質量訓練時序,為記憶增強型機器人策略提供了統一的評估標準。這一突破不僅解決了此前評估碎片化的問題,更通過14種記憶增強型VLA模型的對比實驗,揭示了不同記憶表征的適用場景。

      01.

      為什么機器人"記性差"?傳統評估的三大痛點

      在RoboMME出現之前,機器人記憶相關的評估一直存在明顯短板。現有基準要么只聚焦單一記憶類型,比如MemoryBench僅關注空間記憶,要么任務 horizon 過短,無法真正考驗長期記憶能力。更關鍵的是,大多數基準允許機器人僅通過即時感知就能完成任務,難以觸發真正的歷史依賴推理。

      實際應用中,機器人需要處理的場景遠比想象中復雜。比如家庭服務機器人擦拭桌子時,需要記住已經清潔過的區域;工業機器人裝配零件時,要回憶上一步的操作位置;甚至簡單的"重復三次動作"指令,都需要時間記憶來計數。這些任務的共同特點是,相同的當前觀測可能對應不同的歷史背景,必須依賴記憶才能做出正確決策。

      RoboMME的核心創新在于,所有任務都被設計為非馬爾可夫過程,強制機器人調用歷史信息。例如在StopCube任務中,機器人需要監測不斷擺動的立方體,在它第N次經過目標時精準按下停止按鈕,既需要記住次數(時間記憶),又要追蹤位置(空間記憶),任何單一感知都無法完成。

      02.

      四大記憶維度+16項任務,全面覆蓋機器人記憶場景

      RoboMME的任務設計靈感源自人類記憶的認知理論,將機器人記憶需求拆解為四個核心維度,每個維度對應四個細分任務,形成完整的評估體系。



      時間記憶(temporal memory)聚焦事件計數與序列排序,典型任務包括BinFill和StopCube。在BinFill中,機器人需要將指定數量的不同顏色立方體放入不透明箱子,由于無法直接觀察箱內情況,必須通過記憶追蹤已放置的數量;而StopCube則要求在立方體第2-5次經過目標時按下按鈕,考驗精準的時序計數能力。

      空間記憶(spatial memory)側重遮擋與場景變化下的位置追蹤,VideoUnmaskSwap任務最具代表性。機器人先觀看容器遮擋立方體并交換位置的視頻,隨后需要準確找出隱藏目標立方體的容器,整個過程中無法依賴實時視覺反饋,完全依靠對視頻中空間關系的記憶。

      物體記憶(object memory)關注跨時間的物體身份識別,PickHighlight任務中,機器人按下按鈕后會看到特定立方體被短暫高亮,之后需要在無高亮提示的情況下,準確拾取之前記住的目標物體。而VideoRepick任務則要求機器人從視頻中學習特定立方體的特征,即使該立方體被移動或與其他相似物體混合,仍能重復拾取動作。

      程序記憶(procedural memory)負責存儲和復現動作模式,PatternLock任務中,機器人需要觀看演示視頻中末端執行器在網格上的移動軌跡,之后精準復現相同的路徑順序,誤差超過閾值即判定失敗。InsertPeg任務則要求記住拾取釘子的特定端部和插入方向,考驗精細動作的記憶能力。



      這些任務的難度分為簡單、中等、困難三個等級,通過場景雜亂度、任務時長和環境動態性調節。數據集中包含1600個演示樣本,單個任務的執行步數從幾百到一千多不等,充分模擬真實場景中的長 horizon 需求。



      03.

      14種模型實測:沒有"萬能記憶",只有"精準匹配"

      基于RoboMME基準,研究團隊構建了14種記憶增強型VLA模型,均基于π?.?骨干網絡,分別采用symbolic(符號)、perceptual(感知)、recurrent(循環)三種記憶表征,搭配三種不同的整合機制,形成完整的對比體系。



      符號記憶通過語言子目標總結歷史信息,比如將"已放置2個綠色立方體"編碼為文本指令,再與任務描述拼接輸入模型。實驗中,采用QwenVL生成的grounded subgoals(帶坐標標注的子目標)在BinFill等計數任務中表現突出,成功率達到72.08%,但在StopCube等時間敏感型任務中幾乎失效,成功率接近0。這是因為語言符號難以捕捉精細的時序動態信息。



      感知記憶直接保留歷史視覺特征,通過幀采樣(FrameSamp)或令牌丟棄(TokenDrop)篩選關鍵視覺信息。其中FrameSamp+Modul組合表現最佳,整體成功率達到44.51%,在PatternLock等動作復現任務中優勢明顯,成功率高達53.56%。值得注意的是,TokenDrop由于過度裁剪空間上下文,在需要全局視野的任務中表現不如FrameSamp,印證了視覺完整性對空間記憶的重要性。

      循環記憶通過TTT(測試時訓練)或RMT(循環記憶Transformer)壓縮歷史信息,但其表現出人意料地最差,整體成功率僅在18%-22%之間。研究人員分析,這可能是因為π?.?的淺層循環結構導致訓練不穩定,有效的循環記憶需要更深層次的架構整合。

      三種整合機制中,memory-as-modulator(記憶作為調制器)表現最為均衡,通過自適應LayerNorm調節動作專家的中間激活,既保留了原始模型的預訓練特征,又能有效融入記憶信息。而memory-as-expert雖然增加了專門的記憶處理模塊,但由于參數規模擴大和訓練難度增加,并未帶來顯著性能提升。

      04.

      效率與性能的平衡:感知記憶成最優解

      在機器人實際部署中,計算效率與性能同樣重要。RoboMME的實驗顯示,不同記憶表征的計算成本差異顯著:依賴外部VLM生成子目標的符號記憶模型,計算量是基礎π?.?的3倍;MemER模型由于結合了關鍵幀存儲和符號子目標,計算量更是達到5倍。

      相比之下,感知記憶模型展現出更優的效率-性能平衡。FrameSamp+Modul在記憶預算從64增加到512 tokens的過程中,成功率穩步提升,而計算量僅適度增加。這是因為其計算主要集中在視覺令牌處理,記憶整合本身僅引入輕微開銷。研究人員發現,通過緩存重復的視覺令牌或減少VLM推理頻率,還能進一步降低計算成本。



      更重要的是,這些趨勢在真實世界實驗中得到了驗證。在對應BinFill的PutFruits任務中,符號記憶模型成功率達到90%,擅長計數;而在模仿軌跡的DrawPattern任務中,感知記憶模型成功率80%,遠超前兩者。這表明RoboMME在仿真環境中得出的結論具有很強的遷移價值。

      05.

      人類vs機器:90.5% vs 44.51%,差距在哪里?

      為了建立性能上限,研究團隊還進行了人類對比實驗。18名參與者通過VideoQA方式選擇高level動作,由oracle planner負責低level執行,最終達到90.5%的整體成功率。但人類并非完美,在長horizon的PatternLock任務和時間敏感的StopCube任務中,仍會出現忘記軌跡細節或計數錯誤的情況。



      人類與最優模型(FrameSamp+Modul)的差距主要體現在三個方面:一是對模糊信息的處理能力,人類能快速識別關鍵歷史信息,而機器容易被冗余數據干擾;二是記憶的泛化性,人類能將一種場景的記憶經驗遷移到相似任務,機器則依賴大量標注數據;三是錯誤恢復能力,人類發現記憶偏差后能快速調整,機器往往會持續犯錯。

      這些差距也指明了未來的研究方向。研究團隊表示,RoboMME目前聚焦桌面操作場景,未來將擴展到移動操作任務,并引入更多VLA骨干網絡。而結合符號記憶的高-level推理優勢和感知記憶的低-level精準性,可能是實現更強大記憶增強型機器人的關鍵路徑。

      從技術落地來看,RoboMME的價值不僅在于評估,更在于為實際開發提供指導。比如工業機器人可優先采用感知記憶提升裝配精度,服務機器人可結合符號記憶優化任務規劃,這些基于實驗數據的選型建議,將加速記憶增強型機器人的產業化進程。隨著基準的完善和模型的迭代,未來機器人有望真正擺脫"健忘"的標簽,在復雜場景中展現出類人的記憶與推理能力。

      論文地址:https://arxiv.org/abs/2603.04639

      項目地址:https://robomme.github.io/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      李昊又一逆天撲救!門線極限神撲,媒體人狂贊:國足該場場首發

      李昊又一逆天撲救!門線極限神撲,媒體人狂贊:國足該場場首發

      奧拜爾
      2026-04-17 19:24:25
      2-0!1-1!中超太刺激,升班馬三連勝擋不住,山東泰山主場又丟分

      2-0!1-1!中超太刺激,升班馬三連勝擋不住,山東泰山主場又丟分

      小徐講八卦
      2026-04-18 05:57:03
      建國曝汪小菲猛料,全和S家有關,張蘭傻眼,馬筱梅痛哭真相大白

      建國曝汪小菲猛料,全和S家有關,張蘭傻眼,馬筱梅痛哭真相大白

      萌姐
      2026-04-16 22:55:50
      3-0橫掃!意甲領頭羊踢瘋了,領先那不勒斯12分,甩開米蘭15分

      3-0橫掃!意甲領頭羊踢瘋了,領先那不勒斯12分,甩開米蘭15分

      足球狗說
      2026-04-18 04:46:28
      中國建筑中標阿聯酋首個高鐵項目

      中國建筑中標阿聯酋首個高鐵項目

      GA環球建筑
      2026-04-17 22:16:10
      胡錫進給沃爾沃汽車做廣告,評論區全翻車了……

      胡錫進給沃爾沃汽車做廣告,評論區全翻車了……

      麥杰遜
      2026-04-17 11:51:26
      采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

      采訪了100個娶了小三的男人,他們幾乎都說了同一句話,讓人恍然

      千秋文化
      2026-04-15 20:18:32
      《浪姐7》一公人氣排名,烏蘭圖雅第4,張月第2,冠軍評論區淪陷

      《浪姐7》一公人氣排名,烏蘭圖雅第4,張月第2,冠軍評論區淪陷

      娛樂圈筆娛君
      2026-04-17 18:07:51
      意甲最新積分戰報:科莫爆冷3場不勝,國米大勝擴大領先優勢

      意甲最新積分戰報:科莫爆冷3場不勝,國米大勝擴大領先優勢

      足球狗說
      2026-04-18 05:19:43
      放棄冰球轉行當導演!65歲英達砸數千萬培養終成空,英如鏑曾喊話內涵巴圖

      放棄冰球轉行當導演!65歲英達砸數千萬培養終成空,英如鏑曾喊話內涵巴圖

      喜歡歷史的阿繁
      2026-04-16 15:40:35
      稀土牌打空了?日本公布重大技術突破,對華進口連續兩月掛零

      稀土牌打空了?日本公布重大技術突破,對華進口連續兩月掛零

      究竟誰主沉浮
      2026-04-17 22:02:25
      “阿莫西林”是消炎藥?提醒:真正的消炎藥只有這2種,別用錯了

      “阿莫西林”是消炎藥?提醒:真正的消炎藥只有這2種,別用錯了

      39健康網
      2026-04-16 17:35:53
      大瓜!董事長的私生子

      大瓜!董事長的私生子

      挖掘機007
      2026-04-17 20:30:22
      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      有沒有人敢爆自己的瓜?網友:確定玩這么大嗎?

      夜深愛雜談
      2026-02-18 20:55:58
      阿爾斯通股價大跌36%

      阿爾斯通股價大跌36%

      每日經濟新聞
      2026-04-17 15:24:39
      李宇春咋穿成這樣?為藝術獻身我真的看不懂!

      李宇春咋穿成這樣?為藝術獻身我真的看不懂!

      可樂談情感
      2026-04-18 00:15:49
      一朝曼城,終身藍月!席爾瓦發文告別自由身離隊,卻遭瓜帥吐槽

      一朝曼城,終身藍月!席爾瓦發文告別自由身離隊,卻遭瓜帥吐槽

      夜白侃球
      2026-04-17 10:38:55
      臺北買房無望,馬筱梅吐槽北京房子舊,樓上裝修太吵,人設崩塌了

      臺北買房無望,馬筱梅吐槽北京房子舊,樓上裝修太吵,人設崩塌了

      八斗小先生
      2026-04-17 11:14:22
      特斯拉 Optimus 人形機器人首批量產機型在上海超級工廠正式交付

      特斯拉 Optimus 人形機器人首批量產機型在上海超級工廠正式交付

      新浪財經
      2026-04-17 17:41:19
      有福之人:不是擁有的多,是計較的少

      有福之人:不是擁有的多,是計較的少

      疾跑的小蝸牛
      2026-04-17 22:03:05
      2026-04-18 06:28:49
      機器人大講堂 incentive-icons
      機器人大講堂
      立德機器人平臺,是一個集媒體品牌、智庫咨詢、投資孵化、引智招商為一體的機器人垂直領域服務平臺
      6468文章數 4583關注度
      往期回顧 全部

      科技要聞

      7家頭部平臺被罰沒35.97億元

      頭條要聞

      伊朗拒絕將濃縮鈾運往國外 特朗普發聲

      頭條要聞

      伊朗拒絕將濃縮鈾運往國外 特朗普發聲

      體育要聞

      中超-泰山1-1海港 楊希處子球克雷桑任意球扳平

      娛樂要聞

      劉德華摯友潘宏彬離世 曾一起租房住

      財經要聞

      "影子萬科"2.0:管理層如何吸血萬物云?

      汽車要聞

      又快又穩的開掛動力! 阿維塔06T全系搭分布式電驅

      態度原創

      健康
      親子
      房產
      數碼
      公開課

      干細胞抗衰4大誤區,90%的人都中招

      親子要聞

      誰給女性帶來的壓力更大——男人還是孩子?

      房產要聞

      重磅利好!2500個學位,海口濱江片區,要建九年一貫制學校!

      數碼要聞

      庫克都沒想到:MacBook Neo賣爆了!官網交付已排到5月

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版