<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      一塊GPU訓練,15分鐘內實現仿真實境遷移,人形機器人端到端控制新策略來了!

      0
      分享至

      大數據文摘受權轉載自頭部科技

      文丨譚梓馨

      大規模并行仿真已將機器人強化學習(RL)的訓練時間從數天縮短至數分鐘。

      然而,由于高維性、域隨機化等因素帶來的挑戰,在人形機器人控制方面實現快速且可靠的仿真實境遷移(Sim2Real)仍面臨困難。


      近日,Amazon FAR團隊提出一種基于離策略強化學習算法(即FastSAC與 FastTD3)的簡潔實用方案,僅需單塊RTX 4090 GPU,即可在15分鐘內快速訓練出人形機器人移動控制策略。

      研究人員在宇樹G1(Unitree G1)和加速進化T1(Booster T1)機器人上驗證了該方案的有效性。在強域隨機化條件下,如動力學隨機化、崎嶇地形、推力擾動等,可實現端到端的人形機器人控制策略快速學習,同時也支持全身人體運動跟蹤策略的快速訓練,該方案開源發布在Holosoma代碼庫中。

      極簡策略,給訓練提提速

      仿真實境遷移(Sim2Real)開發本質上是一個迭代過程:在仿真環境中訓練策略并部署到硬件后,會暴露出未建模動力學、感知誤差等域差異問題。

      隨后需通過改進仿真環境修正這些差異,這就要求重新訓練整個流程,由于這類迭代需持續至策略達到可靠水平,因此快速仿真成為保障迭代可行性的關鍵前提。

      盡管現代并行仿真器具備高效特性,但這些迭代周期在實際應用中仍存在較高成本,尤其適用于人形機器人等高維系統時,而想要實現策略向真實世界的魯棒遷移,訓練時間又要重回數小時級別。

      因此,盡管并行仿真在原始吞吐量上實現了顯著提升,但人形機器人領域控制實現快速、可靠的仿真實境遷移迭代仍是一項挑戰。


      這項研究提出的FastSAC and FastTD3方案,將人形機器人仿真實境遷移的迭代時間重新縮短至分鐘級。
      FastSACFastTD3是流行的離策略強化學習算法SAC和TD3的高性能變體,針對大規模并行仿真訓練進行了優化。
      該方案采用大規模并行仿真對FastSAC與FastTD3智能體進行訓練。研究發現,增加并行環境數量的效果在具有挑戰性的全身運動跟蹤任務中尤為顯著,此外,在每個仿真步驟中執行更多梯度更新步驟通常能加快訓練收斂速度。


      訓練SAC或TD3等離策略強化學習算法時,一項核心挑戰是為其雙曲正切(Tanh)策略設置合理的動作邊界,研究人員提出一種簡潔技術:在使用比例-微分(PD)控制器時,基于機器人的關節限位來設定動作邊界。
      他們計算出每個關節的限位與默認位置之間的差值,并將該差值作為對應關節的動作邊界,實驗表明,該方法可有效降低FastSAC與FastTD3訓練過程中動作邊界的調參需求。
      人形機器人移動控制與全身控制的獎勵函數設計,傳統上依賴復雜的獎勵塑形技術,通常包含20余項獎勵項,這項研究證實:通過大幅簡化的目標函數(不足10項獎勵項),即可讓機器人產生魯棒且自然的行為。


      具體而言,該方案遵循極簡獎勵設計理念——僅在必要時添加獎勵項,并力求在不同算法與機器人之間保持近乎一致的獎勵集合,設計目標并非強制機器人遵循特定運動模式,而是在保留行為多樣性的前提下,為魯棒移動控制與全身控制提供足夠的約束結構。


      更少的獎勵項還能簡化超參數調優過程,支持快速遍歷超參數空間,這對于仿真實境遷移的迭代效率至關重要。
      而針對全身運動跟蹤任務,研究人員還發現,以速度推力形式引入外部擾動,可進一步提升仿真實境遷移的魯棒性。

      時間雖短,但效果很好


      研究人員在單塊RTX 4090 GPU上,僅用15分鐘便完成了端到端的完整人形機器人移動控制策略訓練——訓練過程涵蓋動力學隨機化、崎嶇地形、推力擾動等強域隨機化條件,并融入自動動作頻率學習機制。

      來看看實訓效果:


      此外,該離策略強化學習方案具備優異的可擴展性,能夠顯著加速全身運動跟蹤策略的訓練——在4塊L40s GPU、16384個并行環境的配置下,FastSAC與FastTD3算法在相同實驗條件下,學習完成完整舞蹈動作序列的速度也顯著快于PPO算法。

      而且,雖然只接受了15分鐘的訓練,但機器人已能穩定地站立和行走,并且能夠抵抗推力擾動。


      FastSAC與FastTD3同樣能夠快速訓練宇樹G1人形機器人實現人體運動跟蹤,包括持續時間超過2分鐘的長序列舞蹈動作,其性能效果與主流的PPO算法相當或更優。


      亞馬遜發力機器人

      值得關注的是,亞馬遜FAR團隊同步開源了Holosoma,這是一個綜合軟件框架,旨在簡化訓練和部署人形機器人的復雜流程。

      Holosoma源自希臘語,意為“全身”,通過在單個訓練代碼庫中支持多個仿真后端來解決各種仿真環境之間的脫節,以及“后端”碎片化等問題。

      近期報道顯示,亞馬遜的內部目標是在未來幾年內實現75%的運營自動化,在2033年前可能會減少雇傭超過60萬名人類員工,同時還能將運營效率翻一番,要實現這一目標,就需要能夠適應非結構化環境并操作各種物體的機器人——而這些問題是傳統的、硬編碼的自動化方式無法解決的。


      FAR團隊目前匯聚了不少核心華人學者,Rocky Duan目前為FAR研究負責人,此外還匯聚了Peter Chen、Tianhao Zhang、Liang-Chieh Chen、Ziqi Lu等頂尖華人研究員。

      FAR團隊認為,未來將離策略強化學習與人形機器人學習領域的最新進展融入該方案,有望進一步推動該領域的技術前沿。

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      哪些事是外國人到中國后才知道的?網友:你來天朝!你就漲知識吧

      哪些事是外國人到中國后才知道的?網友:你來天朝!你就漲知識吧

      帶你感受人間冷暖
      2025-12-24 00:10:09
      日本加息的真實目的,傷敵一千自損八百,只為拉爆中國房地產

      日本加息的真實目的,傷敵一千自損八百,只為拉爆中國房地產

      小明嘩撲
      2025-12-26 00:34:06
      黑瞎子島零下30℃直播! 72歲董明珠把格力焊死在品質上

      黑瞎子島零下30℃直播! 72歲董明珠把格力焊死在品質上

      別人都叫我阿腈
      2025-12-26 10:44:08
      84歲名導翟俊杰病逝!他生前最驕傲的是:我的一雙兒女都沒有出國

      84歲名導翟俊杰病逝!他生前最驕傲的是:我的一雙兒女都沒有出國

      妙知
      2025-12-26 10:11:04
      喜提獎金+汽車!張本智和對著100名日本人發誓:世乒賽還要拿冠軍

      喜提獎金+汽車!張本智和對著100名日本人發誓:世乒賽還要拿冠軍

      風過鄉
      2025-12-26 21:38:03
      1951年10萬志愿軍差點被殲,危急關頭,一支奇兵從天而降救了他們

      1951年10萬志愿軍差點被殲,危急關頭,一支奇兵從天而降救了他們

      云霄紀史觀
      2025-12-26 18:29:56
      普京也沒想到,土耳其申請退貨,特朗普又贏了?也給中國提了個醒

      普京也沒想到,土耳其申請退貨,特朗普又贏了?也給中國提了個醒

      非凡觀點
      2025-12-26 09:59:29
      主持人劉芳菲登門向龐叔令道歉!家中裝修引熱議!藏品足有一柜子

      主持人劉芳菲登門向龐叔令道歉!家中裝修引熱議!藏品足有一柜子

      小娛樂悠悠
      2025-12-27 08:35:19
      退休后才懂的8個硬道理:幸福從不是憑空掉下來的

      退休后才懂的8個硬道理:幸福從不是憑空掉下來的

      娛樂洞察點點
      2025-12-27 08:32:03
      貴金屬“瘋狂”,現貨白銀漲超10%,紐約鈀金漲14.1%,現貨黃金漲超1%!上期所連發兩條通知

      貴金屬“瘋狂”,現貨白銀漲超10%,紐約鈀金漲14.1%,現貨黃金漲超1%!上期所連發兩條通知

      每日經濟新聞
      2025-12-27 07:25:05
      蔣介石在日記里坦言:重慶談判放走毛澤東,全是因為這兩點!

      蔣介石在日記里坦言:重慶談判放走毛澤東,全是因為這兩點!

      鶴羽說個事
      2025-10-25 11:44:53
      2025年,消失的公司年會。

      2025年,消失的公司年會。

      愛吃糖的貓cat
      2025-12-24 19:01:36
      中國首例五胞胎終于長大了,父親因勞累去世,母親直言后悔生下他們

      中國首例五胞胎終于長大了,父親因勞累去世,母親直言后悔生下他們

      等風來育兒聯盟
      2025-08-01 12:21:35
      前TVB花旦被前未婚夫溫暖舉動感動,坦誠有被愛感覺:我覺得很甜蜜

      前TVB花旦被前未婚夫溫暖舉動感動,坦誠有被愛感覺:我覺得很甜蜜

      TVB劇評社
      2025-12-26 18:03:06
      醫學生真得很硬核,竟然有人因業務不精扎醒植物人!

      醫學生真得很硬核,竟然有人因業務不精扎醒植物人!

      另子維愛讀史
      2025-12-26 23:32:52
      最新 | 雷軍突發!全網禁評!

      最新 | 雷軍突發!全網禁評!

      天津廣播
      2025-12-25 22:55:42
      暴跌40.7%!佛山公寓跌麻了……

      暴跌40.7%!佛山公寓跌麻了……

      樓市滅霸
      2025-12-26 15:12:50
      國家能源集團原董事長劉國躍!被撤銷全國政協委員資格

      國家能源集團原董事長劉國躍!被撤銷全國政協委員資格

      光伏能源圈
      2025-12-26 21:21:51
      于適,你不演古偶是給內娛留活路

      于適,你不演古偶是給內娛留活路

      溫柔娛公子
      2025-12-26 18:45:03
      格雷利什失去寵愛!莫耶斯態度轉變,埃弗頓不愿為其花費5000萬鎊

      格雷利什失去寵愛!莫耶斯態度轉變,埃弗頓不愿為其花費5000萬鎊

      夜白侃球
      2025-12-26 21:29:13
      2025-12-27 11:23:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6811文章數 94522關注度
      往期回顧 全部

      科技要聞

      小米也漲價了!業界稱終端再不漲明年必虧

      頭條要聞

      女子洗澡浴室玻璃突然自爆致受傷 開發商:已超質保期

      頭條要聞

      女子洗澡浴室玻璃突然自爆致受傷 開發商:已超質保期

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經要聞

      注意,開始拉物價了!

      汽車要聞

      保時捷經銷商連夜閉店,維權車主寒風中瑟瑟發抖

      態度原創

      房產
      藝術
      手機
      公開課
      軍事航空

      房產要聞

      炸裂,三亞360億超級清單發布,又一批重大配套要來了!

      藝術要聞

      毛主席致徐悲鴻信件曝光,書法風格引關注。

      手機要聞

      小米17 Ultra今天開售!雷軍:史上最好看的小米影像旗艦

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      英法德三國領導人通話 重申對烏支持

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲成人AV在线| 亚洲中文字幕一区二区| 无码国模在线观看| 日韩人妻精品无码| 亚洲成人色情| 国产精品一久久香蕉国产线看观看 | 熟女毛多熟妇人妻在线视频| 欧美3p视频| 欧美国产精品啪啪| 久久97| 亚洲人妻系列| 台湾色综合| 18无码粉嫩小泬无套在线观看| 国产av日韩av| 国产精品久久久久乳精品爆| 国产男女猛烈无遮挡免费视频网站| 夜夜国自一区| 九九AV| 国产日韩成人内射视频| 萨迦县| 成人天堂资源www在线| 盈江县| 亚洲中文自拍| 久久无码中文字幕免费影院蜜桃| 国产顶级熟妇高潮xxxxx| 欧美不在线| 一二三四日本高清社区5| 综合成人亚洲| 色狠狠色噜噜av天堂一区| 日日干夜夜干| 日韩AV导航| 超碰伊人久久大香线蕉综合| 无遮挡边吃摸边吃奶边做| 2020日韩无码| 香蕉久久国产精品免| 亚洲在线人妻| 石首市| 最新亚洲人成网站在线观看| 日韩伦人妻无码| 韩日一级| 韩日午夜在线资源一区二区|