<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      LaDi-WM模型大幅提升機器人操作策略的成功率和跨場景泛化能力

      0
      分享至



      在機器人操作任務中,預測性策略近年來在具身人工智能領域引起了廣泛關注,因為它能夠利用預測狀態來提升機器人的操作性能。然而,讓世界模型預測機器人與物體交互的精確未來狀態仍然是一個公認的挑戰,尤其是生成高質量的像素級表示。

      為解決上述問題,國防科大、北京大學、深圳大學團隊提出LaDi-WM(Latent Diffusion-based WorldModels),一種基于隱空間擴散的世界模型,用于預測隱空間的未來狀態。

      具體而言,LaDi-WM 利用預訓練的視覺基礎模型 (Vision Fundation Models) 來構建隱空間表示,該表示同時包含幾何特征(基于 DINOv2 構造)和語義特征(基于 Siglip 構造),并具有廣泛的通用性,有利于機器人操作的策略學習以及跨任務的泛化能力。

      基于 LaDi-WM,團隊設計了一種擴散策略,該策略通過整合世界模型生成的預測狀態來迭代地優化輸出動作,從而生成更一致、更準確的動作結果。通過在虛擬和真實數據集上的大量實驗,LaDi-WM 能夠顯著提高機器人操作任務的成功率,尤其是在 LIBERO-LONG 數據集上提升27.9%,超過之前的所有方法。





      • 論文地址:https://arxiv.org/abs/2505.11528
      • 項目主頁:https://guhuangai.github.io/LaDiWM.github.io/

      論文創新點:

      1.一種基于隱空間擴散的世界模型:使用視覺基礎模型構建隱空間的通用表示,并在隱空間學習可泛化的動態建模能力。

      2.一種基于世界模型預測迭代優化的擴散策略:利用世界模型生成未來預測的狀態,將預測的狀態反饋給策略模型,迭代式地優化策略輸出。



      圖 1 :(左)通過任務無關的片段學習隱擴散世界模型;(右)通過世界模型的未來狀態預測來優化策略模型

      技術路線

      該團隊提出一種利用世界模型優化策略學習的框架,以學習機器人抓取操作相關的技能策略。該框架可分為兩大階段:世界模型學習和策略學習。

      A. 世界模型學習:

      (a)隱空間表示:通過預訓練的視覺基礎模型對觀測圖像提取幾何表征與語義表征,其中幾何表征利用 DINOv2 提取,而語義表征則使用 Siglip 提取。

      (b)交互擴散:同時對兩種隱空間表示實施擴散過程,并在擴散過程中讓二者充分交互,學習幾何與語義表征之間的依賴關系,從而促進兩種表示的準確動態預測。



      圖 2 : 基于交互擴散的世界模型架構

      B. 策略模型訓練與迭代優化推理

      (a)結合世界模型的未來預測引導策略學習:將世界模型給出的未來預測作為額外的輸入,引導策略模型的準確動作預測;模型架構基于擴散策略模型,有利于學習多模態動作分布。

      (b)迭代優化策略輸出:策略模型可以在一個時間步多次利用世界模型的未來預測作為引導,從而不斷優化自身的動作輸出。實驗顯示,該方案可以逐漸降低策略模型的輸出分布熵,達到更準確的動作預測。



      圖 3 : 基于未來預測引導的策略模型架構

      實驗結果

      虛擬實驗:

      在公開的虛擬數據集(LIBERO-LONG,CALVIN D-D)中,團隊驗證了所提出框架在機器人抓取相關的操作任務上的性能。在實驗中,世界模型的訓練數據會與策略模型的訓練數據區分開,從而驗證世界模型的泛化能力。對于 LIBERO-LONG,給定語言指令,多次執行并統計機器人完成各項任務的成功率。對于 CALVIN D-D,連續給定五個語言指令,多次執行并統計平均完成任務的數量。

      在 LIBERO-LONG 數據集,為了驗證世界模型對策略模型的引導作用,團隊僅使用 10 條軌跡去訓練各任務,對比結果如表 1 所示。相比于其他方法,LaDi-WM 能夠提供精確的未來預測,并將預測反饋給策略模型,不斷優化動作輸出,僅需少量訓練數據即可達到 68.7% 的成功率,顯著優于其他方法。



      表 1: LIBERO-LONG 性能對比

      在 CALVIN D-D 數據集上,LaDi-WM 同樣展示了在長時任務中的強大性能(表 2)。



      表 2: CALVIN D-D 性能對比

      團隊進一步驗證了所提出框架的可擴展性,如圖 4 所示。

      (a)逐漸增大世界模型的訓練數據,模型的預測誤差逐漸降低且策略性能逐漸提升;

      (b)逐漸增大策略模型的訓練數據,抓取操作的成功率逐漸提升;

      (c)逐漸增大策略模型的參數量,抓取操作的成功率逐漸提升。



      圖 4 : 可擴展性實驗

      為了驗證 LaDi-WM 的跨場景泛化能力,團隊在 LIBERO-LONG 上訓練世界模型,并直接應用于 CALVIN D-D 的策略學習中,實驗結果如表 3 所示。若是使用在 LIBERO-LONG 訓練的原始策略模型,直接應用到 CALVIN D-D 是不工作的(表第一行);而使用在 LIBERO-LONG 訓練的世界模型來引導 CALVIN 環境下的策略學習,則可以比在 CALVIN 環境訓練的原始策略的性能高 0.61(表第三行)。這表明,世界模型的泛化能力要優于策略模型的泛化能力。



      表 3: 跨場景實驗結果。L 代表 LIBERO-LONG,C 代表 CALVIN D-D

      團隊進一步探索了利用世界模型迭代優化的工作原理。團隊收集不同迭代輪次下策略模型的輸出動作并繪制其分布,如圖 5 所示。迭代優化的過程中,輸出動作分布的熵在逐漸降低,這表明策略模型每一步的輸出動作更加穩定,從而提升整體的抓取成功率。



      圖 5 : 迭代優化的動作分布對比

      真機實驗:

      團隊也在真實場景中驗證了所提出框架的性能,具體操作任務包括「疊碗」、「開抽屜」、「關抽屜」以及「抓取物體放入籃子」等,如圖 6 所示。



      圖 6 : (左)真實場景環境;(右)機器人實際操作樣例

      在真實場景中,LaDi-WM 將原始模仿學習策略的成功率顯著提升 20%(表 4)。



      表 4: 真實場景性能對比

      圖 7 展示了最終所得策略模型在不同任務上的執行軌跡,從圖中可以發現,提出的策略能夠在不同光照條件以及不同初始位置的情況下有魯棒的泛化性。



      圖 7 : 真實場景機器人執行軌跡

      總結

      國防科大、北京大學、深圳大學團隊提出了一種隱空間擴散的世界模型 LaDi-WM(Latent Diffusion-based World Models),利用視覺基礎模型提取通用的隱空間表示,并在隱空間學習可泛化的動態建模。同時,團隊提出基于世界模型的未來預測來引導策略學習,在推理階段通過迭代式地優化策略輸出,從而進一步提高策略輸出動作的準確度。團隊通過虛擬與真機上廣泛的實驗證明了 LaDi-WM 的有效性,所提出的方法顯著提升了機器人抓取操作技能的性能。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      劉宇寧這條褲子啊,估計演出還沒演完,就得被他拉進“黑名單”了

      劉宇寧這條褲子啊,估計演出還沒演完,就得被他拉進“黑名單”了

      小光侃娛樂
      2025-11-23 11:50:03
      場均13.8分6次助攻,徐杰已經成為國內最強控衛,必須入選國家隊

      場均13.8分6次助攻,徐杰已經成為國內最強控衛,必須入選國家隊

      孤影來客
      2025-12-22 23:53:22
      德天空:拜仁與基亞拉續約談判已有進展,他在俱樂部計劃中

      德天空:拜仁與基亞拉續約談判已有進展,他在俱樂部計劃中

      懂球帝
      2025-12-22 18:33:20
      “我不會結婚”北京理工女大學生語出驚人:窮人生孩子是不負責任

      “我不會結婚”北京理工女大學生語出驚人:窮人生孩子是不負責任

      春序娛樂
      2025-07-12 09:17:52
      饒毅:應該給我國30到55歲的中青年科學家漲薪,砍掉幾個大項目用于中青年人才

      饒毅:應該給我國30到55歲的中青年科學家漲薪,砍掉幾個大項目用于中青年人才

      化學人生
      2025-12-22 21:14:30
      王勵勤改革!王楚欽訓練備戰乒超,有望再戰樊振東,附上比賽時間

      王勵勤改革!王楚欽訓練備戰乒超,有望再戰樊振東,附上比賽時間

      侃球熊弟
      2025-12-23 01:15:03
      字越少,事越大!

      字越少,事越大!

      互聯網思維
      2025-12-19 23:32:33
      冉瑩穎開心壞了!二兒子打生長素1年長8cm,骨齡小有望長到177cm

      冉瑩穎開心壞了!二兒子打生長素1年長8cm,骨齡小有望長到177cm

      瘋說時尚
      2025-12-22 16:38:54
      退出國家隊?抵達北京,18歲全紅嬋發聲,官宣決定,陳若琳期待

      退出國家隊?抵達北京,18歲全紅嬋發聲,官宣決定,陳若琳期待

      懂球社
      2025-12-22 12:29:07
      手握339億現金,賣一輛賺862塊!昔日快倒閉車企,已成新勢力榜首

      手握339億現金,賣一輛賺862塊!昔日快倒閉車企,已成新勢力榜首

      財經八卦
      2025-12-22 20:57:23
      伊森:比賽輸球完全是我的錯,我不該最后時刻去協防

      伊森:比賽輸球完全是我的錯,我不該最后時刻去協防

      懂球帝
      2025-12-22 15:42:17
      碧桂園裁員超11萬人

      碧桂園裁員超11萬人

      地產微資訊
      2025-12-21 09:06:40
      湖南天氣:降溫+降雨+大風!明日高海拔地區有雪

      湖南天氣:降溫+降雨+大風!明日高海拔地區有雪

      三湘都市報
      2025-12-23 00:09:10
      499隔衣服摸胸!私人影院暗藏涉黃:299元起步撕絲襪,還有更過火

      499隔衣服摸胸!私人影院暗藏涉黃:299元起步撕絲襪,還有更過火

      鋭娛之樂
      2025-12-22 14:10:46
      夫妻結婚1年鬧離婚!妻子要每周3次,丈夫床中間加木板,法院判了

      夫妻結婚1年鬧離婚!妻子要每周3次,丈夫床中間加木板,法院判了

      一絲不茍的法律人
      2025-09-03 11:19:56
      南京博物院前院長徐湖平,退休金2萬多,不承認6800元賣掉江南春

      南京博物院前院長徐湖平,退休金2萬多,不承認6800元賣掉江南春

      漢史趣聞
      2025-12-21 17:02:43
      醫生發現:愛吃肉的人,健康指數是愛吃蔬菜的人的10倍不止?

      醫生發現:愛吃肉的人,健康指數是愛吃蔬菜的人的10倍不止?

      健康科普365
      2025-12-22 11:25:10
      穩操勝券的比賽山東居然被3分絕殺,邱彪心慈手軟造懸念退出前八

      穩操勝券的比賽山東居然被3分絕殺,邱彪心慈手軟造懸念退出前八

      光輝記
      2025-12-23 00:10:51
      你敢斷供,我就換供應商,安世中國話音剛落,新供應鏈突然上馬!

      你敢斷供,我就換供應商,安世中國話音剛落,新供應鏈突然上馬!

      古事尋蹤記
      2025-12-22 07:11:18
      吳敬中死前對余則成說:"在天津找穿藍旗袍的女人,她知道你身份"

      吳敬中死前對余則成說:"在天津找穿藍旗袍的女人,她知道你身份"

      飯小妹說歷史
      2025-12-16 16:38:39
      2025-12-23 02:19:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11971文章數 142516關注度
      往期回顧 全部

      科技要聞

      商湯聯創親自下場 痛批主流機器人技術大錯

      頭條要聞

      北約秘書長:向烏克蘭駐軍細節正在加緊制定中

      頭條要聞

      北約秘書長:向烏克蘭駐軍細節正在加緊制定中

      體育要聞

      戴琳,中國足球的反向代言人

      娛樂要聞

      張柏芝不再隱瞞,三胎生父早有答案?

      財經要聞

      央行信用新政:為失信者提供"糾錯"通道

      汽車要聞

      可享88元抵2000元等多重權益 昊鉑A800開啟盲訂

      態度原創

      時尚
      健康
      房產
      數碼
      軍事航空

      珍珠配美人,最老派也最高級的時髦

      這些新療法,讓化療不再那么痛苦

      房產要聞

      重磅!海南發布島內居民免稅商品經營主體及免稅店管理辦法征求意見稿!

      數碼要聞

      華為MatePad 11.5 2026平板搭載麒麟T82B / T82處理器

      軍事要聞

      俄軍中將在汽車炸彈爆炸中身亡 現場畫面披露

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 多p在线观看| 亚洲欧美国产免费综合视频| 久久中精品中文字幕入口| 亚洲一区二区三区国产精华液| 国内精品伊人久久久久7777 | 日韩成人社区| 免费裸体无遮挡黄网站免费看| 岛国AV在线| 熟妇的奶头又大又长奶水视频| 中国极品少妇xxxxx| 国模精品视频一区二区| 超碰AV在线| 色av永久无码影院av| 国产av影院| 女人裸体性做爰视频| 陈巴尔虎旗| 亚洲av永久无码一区二区三区| 国产va| 久久亚洲av午夜福利精品一区| 国产丝袜精品在线播放| 电影久久久久久| 国产白丝jk捆绑束缚调教视频| 日产精品久久久一区二区| 欧美深度肠交惨叫| 人妻超碰在线| 91导航| 伊人不卡不卡| 尼勒克县| 狠狠躁夜夜躁人人爽天天天天97| 久久精品亚洲中文无东京热| 色综合久久中文| 南皮县| 在线看国产精品自拍内射| 日产精品久久久久久久| 久久精品人人做人人爽97| 日韩人妻系列无码专区| 亚洲成人视屏| 亚洲国产成人久久综合| 怀化市| 把腿张开ji巴cao死你h| 亚洲伊人成无码综合网|