<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      字節新機器人亮相,學會穿鞋帶了!

      0
      分享至


      機器人前瞻(公眾號:robot_pro)
      作者 江宇
      編輯 漠影

      機器人前瞻12月2日報道,今日,字節跳動Seed具身智能團隊發布最新成果強化訓練模型GR-RL,首次在真機條件下完成“整只鞋連續穿鞋帶”任務,并在這一精細操控場景中將成功率從45.7%提升至83.3%,減少了近70%的失敗情況。


      ▲ByteMini-v2完成“穿鞋帶”任務

      與此前主要依靠模仿學習的路線不同,該成果采用了真機強化學習(Real-world Reinforcement Learning)的方式,通過多階段訓練框架提升機器人在長程任務中的穩定表現。


      值得注意的是,今年7月22日,Seed團隊曾發布了通用機器人模型GR-3及雙臂移動機器人ByteMini,展示了其在泛化、新環境適應及柔性物體操作方面的能力。

      本次研究則在長時程精細靈巧操作方向進一步推進,新一代雙臂輪式機器人ByteMini-v2也同步亮相。


      ▲上為ByteMini,下為ByteMini-v2

      論文鏈接:https://arxiv.org/abs/2512.01801
      項目主頁:https://seed.bytedance.com/gr_rl

      一、從“看得懂”到“做得準”,穿鞋帶是通用模型失效的典型場景

      Seed團隊將穿鞋帶設為驗證任務,是因為它集中體現了真實環境中的三類難點:柔性物體的不確定性、毫米級的穿孔精度、以及多步驟連續執行的穩定性。

      鞋帶會隨牽引和摩擦即時改變狀態,孔徑較小,對抓取角度要求嚴格,機器人需要在持續的視覺反饋中調整動作。而整個過程可能持續數分鐘,每一次滑落、偏移或姿態變化,都可能影響后續動作。

      Seed團隊發現,基于模仿學習、具有較強泛化能力的通用模型GR-3在這一任務上的表現也不穩定,他們將這種情況歸因于模仿學習的結構性限制

      一是人類演示數據存在“次優片段”,人類演示包含放慢、猶豫、嘗試與回退等片段,模型在學習過程中會一并吸收,從而產生“動作保守”“執行停頓”等行為;

      二是訓練與推理存在“執行錯位”,訓練階段學到的是預測動作,而部署時執行的動作經過推理平滑、軌跡整形等處理,這種訓練與執行之間的偏移,在毫米級任務中會被放大。

      這將導致:模型即使“理解”人類動作,而是在關鍵節點上缺乏連續性與決斷性,難以把任務高效完成。

      二、GR-RL的核心思路:從篩掉“壞動作”開始,再讓機器人自己積累經驗

      GR-RL并非簡單增加數據量或延長訓練時間,而是在結構上引入了一個額外的判別器網絡(Critic Transformer),用于判斷每一個動作片段的價值,對動作序列中每個時刻的動作都進行一次打分


      ▲GR-RL的模型架構

      Seed團隊在離線數據中標記出“演示重新開始”的關鍵幀,將其之前的片段視為負樣本,用于補足失敗數據來源。這樣做的目的,是讓模型在監督學習前先學會辨別哪些行為在后續執行中會導致失敗。

      在此基礎上,Seed團隊使用時序差分方法訓練評估網絡,以動作后果作為回報信號,過濾掉質量較低的軌跡片段,保留較穩定的演示數據作為基礎策略。


      ▲評估模型評判采集軌跡片段的好壞

      由于穿鞋帶涉及空間關系和左右協同動作,Seed團隊對圖像、機器人狀態及動作軌跡進行鏡像增強,使模型在雙臂協作中獲得對稱性理解,從而減少對單一演示路徑的依賴。

      GR-RL訓練的第二階段發生在真實機器人上。Seed團隊采用導向強化學習方法,通過調整模型生成動作的隱空間噪聲,使其在實際探索中逐漸靠近更高回報的策略,而不是在關節層面隨機擾動。


      ▲ByteMini-v2機器人

      為了防止模型“遺忘先前策略”或短期偏移,他們引入“雙緩沖池”策略,將歷史軌跡與最新軌跡分開存儲,訓練時按固定比例抽取,保證探索與穩定并行。

      這種訓練方式的核心是在“允許模型犯錯”的前提下,讓它逐步形成適應真實環境的動作序列。

      三、ByteMini-v2真機完成驗證,成功率階梯式提升

      GR-RL的驗證是在雙臂輪式機器人ByteMini-v2上完成的。與初代相比,該機型保留了多自由度結構,并通過球形腕部關節獲得更靈活的局部動作空間,適合在狹窄區域完成旋轉與穿孔操作。

      實驗使用稀疏獎勵策略,即任務完全完成才計分,其余情況均為0。這一設定避免了模型對局部中間狀態的過度依賴,也提高了對整體策略的約束。

      實驗中,基線模型GR-3的成功率為45.7%。在離線數據過濾后,成功率提升至61.6%,加入鏡像增強后達到72.7%

      在此基礎上進行約150條真機探索后,最終成功率提升至83.3%。這種結果呈現出明顯的“階梯式”變化,與訓練流程中每一階段的作用對應。


      ▲左圖:多階段訓練實現階梯式成功率提升;右圖:在線強化學習的成功率變化曲線

      在多輪實驗中,Seed團隊還觀察到任務執行過程中的行為變化。當鞋帶在穿孔過程中滑落時,模型會重新進行抓取或調整角度。當初始擺放夾帶阻礙時,模型會改變狀態再繼續執行任務。




      ▲面對失誤情況能自發重試,擺放位置別扭時會主動調整。

      這些行為并非額外編碼,而是強化階段逐漸形成的策略表現。它們呈現為一種連續執行能力,而非記憶某一條“正確答案”。

      結語:從實驗室到人類家庭,精細操作依然是具身智能的“門檻”

      在數據驅動和模型擴大的推動下,具身智能已經能完成越來越多看得懂、能上手的任務。

      但當機器人離開實驗室,走進真實家庭,面對穿鞋帶這種看似普通、卻涉及柔性物體、連續動作和高精度控制的任務時,通用模型的能力邊界就會暴露出來。

      機器人不僅要看得清,還要在不斷的反饋中穩定執行任務,這一環節目前仍是最難被可靠解決的部分。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      80后已經有1100萬人提前下車了。

      80后已經有1100萬人提前下車了。

      愛吃糖的貓cat
      2025-11-16 18:27:38
      有家難回?上海一男子求救:根本進不了門!天冷了,你有這種困擾嗎?

      有家難回?上海一男子求救:根本進不了門!天冷了,你有這種困擾嗎?

      縱相新聞
      2026-01-11 14:13:25
      300億大案!公安部出手,這幫吃人不吐骨頭的“吸血鬼”終于涼了

      300億大案!公安部出手,這幫吃人不吐骨頭的“吸血鬼”終于涼了

      泠泠說史
      2026-01-06 18:56:19
      苗苗鄭愷的農場火了!種了一大片菜,養了300只小動物

      苗苗鄭愷的農場火了!種了一大片菜,養了300只小動物

      每日一見
      2025-12-23 21:05:21
      張水華:我最好說話!同事找我調休我都同意 辭職沒和她們打招呼

      張水華:我最好說話!同事找我調休我都同意 辭職沒和她們打招呼

      念洲
      2026-01-12 13:02:28
      你穿什么衣服,很大概率就是什么命,別不信!

      你穿什么衣服,很大概率就是什么命,別不信!

      唯晨說
      2026-01-11 13:34:23
      馬杜羅的最新消息,來自美國監獄!

      馬杜羅的最新消息,來自美國監獄!

      占豪
      2026-01-12 00:09:36
      19分大逆轉,愛德華茲準絕殺!森林狼對陣馬刺5連勝化身文班克星

      19分大逆轉,愛德華茲準絕殺!森林狼對陣馬刺5連勝化身文班克星

      鍋子籃球
      2026-01-12 13:48:25
      相聲演員笑林:不抽煙,不喝酒,一天100個俯臥撐,59歲驟然離世

      相聲演員笑林:不抽煙,不喝酒,一天100個俯臥撐,59歲驟然離世

      林雁飛
      2026-01-10 15:24:20
      伊朗宗教高層:若哈梅內伊遭襲,將對美以發動全球圣戰

      伊朗宗教高層:若哈梅內伊遭襲,將對美以發動全球圣戰

      桂系007
      2026-01-12 00:23:38
      樓市保衛戰打響!央媒:房子是最大資產,2026房地產要下猛藥了?

      樓市保衛戰打響!央媒:房子是最大資產,2026房地產要下猛藥了?

      boss外傳
      2026-01-12 08:00:09
      兩岸終于等來好消息!國共將再次歷史性握手!統一拐點正在逼近

      兩岸終于等來好消息!國共將再次歷史性握手!統一拐點正在逼近

      南宗歷史
      2026-01-12 14:04:54
      香港餐廳收內地客“天價”小費?港人怒批:香港結業潮是有原因的

      香港餐廳收內地客“天價”小費?港人怒批:香港結業潮是有原因的

      朝子亥
      2026-01-06 11:35:03
      中國選手澳網首勝!朱琳兩盤橫掃過關,順利躋身資格賽第2輪

      中國選手澳網首勝!朱琳兩盤橫掃過關,順利躋身資格賽第2輪

      全景體育V
      2026-01-12 10:54:43
      導彈崩飛實驗室、蚊子生產基地,這就是2025年的Nature十大人物!

      導彈崩飛實驗室、蚊子生產基地,這就是2025年的Nature十大人物!

      差評XPIN
      2026-01-11 14:22:42
      專題片剖析唐仁健案:組建“周末愉快”微信群,每到周末就召老板們吃喝

      專題片剖析唐仁健案:組建“周末愉快”微信群,每到周末就召老板們吃喝

      澎湃新聞
      2026-01-11 20:44:28
      停播7年,那個挽救無數司機的“網紅交警”譚喬,卻挽救不了自己

      停播7年,那個挽救無數司機的“網紅交警”譚喬,卻挽救不了自己

      以茶帶書
      2025-12-18 17:14:01
      利雅得德比!海外情報:利雅得新月3-2利雅得勝利

      利雅得德比!海外情報:利雅得新月3-2利雅得勝利

      嘴角上翹
      2026-01-12 11:02:00
      中央定調,2026延遲退休繼續,晚退一年,養老金能多漲10%嗎?

      中央定調,2026延遲退休繼續,晚退一年,養老金能多漲10%嗎?

      深析古今
      2026-01-12 13:40:45
      創業板指跌逾1% 寧德時代跌超4%

      創業板指跌逾1% 寧德時代跌超4%

      財聯社
      2026-01-12 10:05:18
      2026-01-12 14:48:49
      機器人前瞻
      機器人前瞻
      專注于機器人報道的媒體
      300文章數 7關注度
      往期回顧 全部

      科技要聞

      小米二手車價大跳水:SU7半年跌5萬元

      頭條要聞

      德國就"奪島"發聲:國際法原則適用所有國家 包括美國

      頭條要聞

      德國就"奪島"發聲:國際法原則適用所有國家 包括美國

      體育要聞

      聰明的球員,不是教練教出來的

      娛樂要聞

      閆學晶:脫離群眾太久 忘了自己的根

      財經要聞

      揭秘“穩賺不賠”的代工項目騙局

      汽車要聞

      增配不加價 北京現代 第五代 勝達2026款上市

      態度原創

      數碼
      教育
      時尚
      本地
      健康

      數碼要聞

      諾基亞與海信達成專利訴訟和解,就視頻技術簽署許可協議

      教育要聞

      揭秘學霸考場小動作:監考老師看見也不攔,因為實在太聰明了

      普通人就該照搬這些穿搭!衣服不用買太貴,自然耐看又舒適

      本地新聞

      云游內蒙|“包”你再來?一座在硬核里釀出詩意的城

      血常規3項異常,是身體警報!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本熟妇色xxxxx日本免费看| 野花韩国日本免费观看| 国产大片黄在线观看私人影院 | 内射视频福利在线观看| 99久久无色码中文字幕人妻| 女女互磨互喷水高潮les呻吟| 在线精品亚洲一区二区绿巨人| aa性欧美老妇人牲交免费| 人妻少妇嫩草AV无码 | 成人性生交大片免费卡看| 插插射啊爱视频日a级| 在线a久青草视频在线观看| 91丨九色丨拳交| 曾医生17分钟??下载| 影音先锋一区二区| AV人摸人人人澡人人超碰下载| 日本欧美大码a在线观看| 亚洲精品久久久久久久蜜桃臀| 69久久精品无码一区二区| 国产主播无套内射一区| 亚洲熟妇色自偷自拍另类| 在线播放日韩一区| 果冻传媒18禁免费视频| 亚洲国产VA| 亚洲高清无码人妻| 欧美青青草| 亚洲AV无码成人精品区东京热| 亚洲精品成人一二三专区| 久久狠狠高潮亚洲精品| 内地自拍三级在线观看| 亚洲精品理论电影在线观看| 无码成人AV在线看免费| 亚洲丶国产丶欧美一区二区三区 | 又粗又黄又猛又爽大片免费| 少妇做爰免费视看片| 无码123| 在线天堂www在线| 99视频精品3| 国产精品无码成人午夜电影| 中文a片| 亚洲成人无码中文字幕|