<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      告別機器人“斷片”!KAIST和UC Berkeley團隊讓VLA模型擁有記憶

      0
      分享至

      機器人伸手去拿桌上的杯子,它需要知道自己剛才有沒有抓住過這個杯子嗎?答案是肯定的。但現有的視覺-語言-動作模型(VLA)大多只盯著當前畫面做決策,完全沒有“歷史記憶”。這就導致機器人在處理遮擋物體、多步驟堆疊這類需要上下文的任務時,很容易陷入混亂。



      近日,來自KAIST和UC Berkeley 的團隊提出了一個名為HAMLET的框架,給預訓練VLA模型補上了“歷史感知”的短板。這個輕量級插件不需要從頭訓練大模型,卻能讓機器人在長時操控任務中,平均成功率直接提升47.2%。在真實場景的“蓋方塊 疊杯子”任務里,HAMLET更是把成功率從37.5%拉到了79.2%,徹底解決了機器人“斷片”的問題。

      01.

      沒有記憶的機器人 連疊杯子都做不好

      當下主流的VLA模型,比如GR00T N1.5、CogACT,都遵循“單幀假設”,只靠當前的視覺畫面和文本指令來預測下一步動作。這種設計在簡單任務里沒問題,但遇到需要上下文的長時任務,就會立刻露怯。

      舉個例子,“用最近的杯子蓋住方塊,再把另一個杯子疊上去”這個任務,當機器人用第一個杯子蓋住方塊后,方塊就被遮擋住了。如果沒有歷史記憶,機器人看著眼前的兩個杯子,根本不知道哪個杯子下面藏著方塊,大概率會重復抓取同一個杯子。論文里的實驗也印證了這一點:GR00T N1.5在這個任務上的成功率只有37.5%,甚至會出現“拿起杯子又放下,反復橫跳”的滑稽場面。

      更麻煩的是,給模型簡單堆砌歷史幀根本行不通。研究團隊發現,在VLA輸入里多塞4幀歷史畫面,會讓模型的前向推理速度變慢35%,峰值內存占用直接暴漲3.6倍。這種粗暴的方法不僅效率低下,還會因為引入冗余信息,導致模型在復雜場景下的泛化能力下降。

      02.

      HAMLET的兩大核心:給每一刻“拍快照”,再用記憶模塊整合

      HAMLET的巧妙之處在于,它沒有拋棄現有的VLA模型,而是通過兩個核心組件,給模型加裝了一個輕量化的“記憶系統”,整個過程只需要微調,不用從頭訓練。

      1、時刻令牌:給每個時間步拍一張“信息快照”

      首先,HAMLET設計了 時刻令牌(moment tokens) ,用來給每個時間步的場景信息做“壓縮存檔”。這些令牌是可學習的向量,會被拼接到VLA模型的輸入序列里。



      為了讓時刻令牌只記住關鍵信息,團隊用了時間對比學習(TCL)的方法來初始化它們。具體來說,就是讓同一個時間步的增強圖像(比如加了模糊、噪聲的版本)對應的令牌盡可能相似,讓不同時間步的令牌盡可能不同。這樣一來,時刻令牌就會自動忽略掉桌子、墻壁這些靜態背景,只聚焦于機器人抓手、待操作物體這些動態變化的關鍵區域。

      經過TCL初始化的時刻令牌,相當于給每個時間步的場景拍了一張“信息快照”,既保留了任務相關的動態特征,又剔除了冗余信息,為后續的記憶整合打下了基礎。

      2、輕量記憶模塊:只提取有用的歷史信息

      有了時刻令牌這個“快照庫”,接下來就需要一個 記憶模塊 來篩選和整合這些快照。HAMLET沒有用復雜的循環神經網絡,而是選擇了一個兩層的Transformer架構,專門用來處理歷史時刻令牌。



      這個記憶模塊會把最近的T個時刻令牌堆疊成一個歷史矩陣,再通過因果自注意力機制,自動判斷哪些歷史時刻對當前決策更重要。比如在“交換兩個方塊”的任務中,當機器人需要決定下一步抓哪個方塊時,記憶模塊會重點關注“藍色方塊被放到輔助位置”的那個時間步,而忽略掉無關的移動過程。

      最終,記憶模塊會輸出一個融合了歷史信息的特征向量,把它和VLA模型原本的單幀特征拼接在一起,再輸入到動作預測頭里。這樣一來,模型就能同時參考當前畫面和歷史上下文,做出更準確的決策。

      03.

      實測:長時任務成功率碾壓基線,效率還更高

      為了驗證HAMLET的效果,團隊在真實機器人和仿真環境中做了大量實驗,測試對象包括GR00T N1.5和CogACT兩款主流VLA模型。



      在真實場景的三項長時任務中,HAMLET的表現堪稱驚艷。在“兩次拾取放置”任務里,它把GR00T N1.5的成功率從12.5%提升到66.7%;在“交換方塊”任務中,成功率從37.5%躍升至83.3%,平均成功率直接達到76.4%,比基線模型高出47.2個百分點。



      即便是在通用仿真基準測試中,HAMLET也展現出了強大的泛化能力:在RoboCasa Kitchen數據集上,它把成功率從64.1%提升到66.4%;在LIBERO數據集上,更是將行業領先的95.6%成功率推高到97.7%。



      更關鍵的是,HAMLET在提升性能的同時,還保持了極高的效率。對比簡單堆疊歷史幀的方法,當歷史長度為8時,后者會讓模型推理速度變慢2.4倍,內存占用暴漲7倍;而HAMLET的推理速度僅增加7%,內存占用僅增加1倍,完全不會給部署帶來額外負擔。

      04.

      不只是 機器人:記憶模塊還能跨任務遷移

      HAMLET的另一個驚喜之處在于,它的記憶模塊具備 跨任務遷移能力 。團隊做了一個有趣的實驗:先在LIBERO數據集上訓練記憶模塊,然后直接把它遷移到RoboCasa Kitchen數據集上測試。結果顯示,遷移后的記憶模塊依然能讓模型成功率提升1.9個百分點,幾乎和在目標數據集上訓練的效果持平。

      這意味著,HAMLET的記憶模塊學到的不是某個特定任務的歷史規律,而是一種通用的“歷史信息處理能力”。未來只要在一個數據集上訓練好記憶模塊,就能直接用到其他機器人操控任務中,大大降低了部署成本。

      05.

      結語與未來:

      HAMLET的出現,解決了VLA模型“沒有歷史記憶”的核心痛點。它不需要重構大模型的架構,也不需要海量的訓練數據,只通過時刻令牌和輕量記憶模塊的組合,就能讓現有VLA模型快速具備歷史感知能力。

      在機器人邁向通用化的路上,“記憶”無疑是不可或缺的一環。當機器人能記住自己剛才做了什么,能分辨出哪個物體是之前操作過的,它才能真正理解復雜的人類指令,完成更具挑戰性的長時操控任務。

      論文地址:https://arxiv.org/pdf/2510.00695

      項目地址:https://myungkyukoo.github.io/hamlet/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      全球只有5位領導人被永久保留遺體,他們都是誰

      全球只有5位領導人被永久保留遺體,他們都是誰

      扶蘇聊歷史
      2026-01-29 16:13:42
      傻白糖被插足鬧自殺

      傻白糖被插足鬧自殺

      毒舌扒姨太
      2026-02-23 22:34:32
      現貨黃金上漲近2%

      現貨黃金上漲近2%

      每日經濟新聞
      2026-02-24 00:03:05
      深圳路邊停車擬出新規!不再強制立即繳費!但長期欠費將受罰!

      深圳路邊停車擬出新規!不再強制立即繳費!但長期欠費將受罰!

      深圳本地寶
      2026-02-23 18:14:03
      中國50后還有多少人?多少人能活到80歲?權威數據告訴你

      中國50后還有多少人?多少人能活到80歲?權威數據告訴你

      芭比衣櫥
      2026-02-19 21:00:42
      今日!CCTV5直播國乒王楚欽等出戰+斯諾克趙心童亮相,網絡轉NBA

      今日!CCTV5直播國乒王楚欽等出戰+斯諾克趙心童亮相,網絡轉NBA

      晚池
      2026-02-24 00:13:42
      炸鍋!利物浦皇馬驚天互換?1 億先生轉會真相被扒

      炸鍋!利物浦皇馬驚天互換?1 億先生轉會真相被扒

      瀾歸序
      2026-02-24 07:07:44
      馬英九言論引關注:統一最后時刻,大陸準備戰爭,臺美需深思

      馬英九言論引關注:統一最后時刻,大陸準備戰爭,臺美需深思

      領悟看世界
      2026-02-15 01:21:14
      你最爽的經歷是什么?網友:約過一個比我大好幾歲的姐姐

      你最爽的經歷是什么?網友:約過一個比我大好幾歲的姐姐

      帶你感受人間冷暖
      2026-02-16 01:10:39
      78歲連路都走不穩還開演唱會,全網罵聲一片,她卻揚言回饋粉絲

      78歲連路都走不穩還開演唱會,全網罵聲一片,她卻揚言回饋粉絲

      洲洲影視娛評
      2026-01-28 12:23:18
      在質疑聲中進步 約克雷斯本賽季已進15球 造阿森納8年新紀錄

      在質疑聲中進步 約克雷斯本賽季已進15球 造阿森納8年新紀錄

      智道足球
      2026-02-23 17:49:53
      太陽報:萬-比薩卡女友因車禍致行人重傷被起訴,兩人現身法庭

      太陽報:萬-比薩卡女友因車禍致行人重傷被起訴,兩人現身法庭

      懂球帝
      2026-02-23 14:46:04
      美國運通跌幅擴大至6.3%

      美國運通跌幅擴大至6.3%

      每日經濟新聞
      2026-02-23 23:22:09
      約基奇生涯第9次30+20+10!近50年其他球員總計僅6次

      約基奇生涯第9次30+20+10!近50年其他球員總計僅6次

      北青網-北京青年報
      2026-02-23 19:34:03
      未知:一種關于可能的溫柔留白

      未知:一種關于可能的溫柔留白

      疾跑的小蝸牛
      2026-02-23 22:48:10
      你見過最離譜的網購是什么?網友:倉庫是不會承認自己發錯了的

      你見過最離譜的網購是什么?網友:倉庫是不會承認自己發錯了的

      另子維愛讀史
      2026-02-16 20:35:50
      美國十大領域全球領跑,差距還在拉大,正視實力才是真清醒!

      美國十大領域全球領跑,差距還在拉大,正視實力才是真清醒!

      保德全
      2026-02-03 19:30:03
      2月23日俄烏:烏克蘭無人機再炸莫斯科

      2月23日俄烏:烏克蘭無人機再炸莫斯科

      山河路口
      2026-02-23 19:06:10
      Cell子刊:浙江大學王迪/丁克峰團隊揭示,僅需16小時禁食,增強癌癥免疫治療效果

      Cell子刊:浙江大學王迪/丁克峰團隊揭示,僅需16小時禁食,增強癌癥免疫治療效果

      生物世界
      2026-02-22 12:05:46
      說實話我真的不敢相信她已經61歲了,看起來竟然像四十歲左右

      說實話我真的不敢相信她已經61歲了,看起來竟然像四十歲左右

      今日搞笑分享
      2026-02-22 13:36:55
      2026-02-24 08:51:00
      機器人大講堂 incentive-icons
      機器人大講堂
      立德機器人平臺,是一個集媒體品牌、智庫咨詢、投資孵化、引智招商為一體的機器人垂直領域服務平臺
      6297文章數 4577關注度
      往期回顧 全部

      科技要聞

      AI顛覆發展最新犧牲品!IBM跳水重挫超13%

      頭條要聞

      牛彈琴:白宮突然發了張圖 傷害性不大侮辱性極強

      頭條要聞

      牛彈琴:白宮突然發了張圖 傷害性不大侮辱性極強

      體育要聞

      蘇翊鳴總結米蘭征程:我仍是那個熱愛單板滑雪的少年

      娛樂要聞

      那藝娜賬號被禁止關注,視頻已清空!

      財經要聞

      速覽!假期這些大事影響節后市場

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      手機
      游戲
      時尚
      數碼
      房產

      手機要聞

      近20年來首次改名:蘋果iOS 26.4 Beta 2核心啟動器更名mBoot

      離譜!LOL世界冠軍慘遭淘汰,曾效力LPL的4名韓援,如今全被淘汰

      今年春天一定要擁有的針織,這樣穿減齡又好看!

      數碼要聞

      REDMI產品經理:Turbo 5 Max 1TB版備貨極少 不會再追加

      房產要聞

      窗前即地標!獨占三亞灣C位 自貿港總裁行宮亮相

      無障礙瀏覽 進入關懷版