人形機(jī)器人訓(xùn)練流程可簡(jiǎn)單表示為:捕捉人類動(dòng)作,并將其重新分配給機(jī)器人,在模擬環(huán)境中大規(guī)模訓(xùn)練,部署到硬件上,然后進(jìn)行迭代。
波士頓動(dòng)力AI實(shí)驗(yàn)室,展示了類人機(jī)器人Atlas如何學(xué)習(xí)新的動(dòng)作,如何在模擬中放大這些動(dòng)作,然后將這些技能帶入真實(shí)的機(jī)器人應(yīng)用中。
端到端的管道
越來(lái)越多的人形團(tuán)隊(duì)正在采用以下模式訓(xùn)練機(jī)器人:
捕獲人類運(yùn)動(dòng) → 轉(zhuǎn)發(fā)到機(jī)器人 → 在模擬中大規(guī)模訓(xùn)練 → 部署到硬件 → 重復(fù)
操作方法:
步驟 1. 捕獲:將人類運(yùn)動(dòng)轉(zhuǎn)化為訓(xùn)練數(shù)據(jù)
在這個(gè)環(huán)節(jié)中,研究員將穿著Xsens動(dòng)作捕捉服來(lái)記錄全身的動(dòng)作。捕捉到的動(dòng)作將成為參考行為。
動(dòng)作學(xué)習(xí)始于良好的數(shù)據(jù)。因此動(dòng)作清晰(關(guān)節(jié)角度、時(shí)機(jī)、協(xié)調(diào))至關(guān)重要,Xsens采集到的動(dòng)作數(shù)據(jù)可用作可重復(fù)使用的參考,并可以迭代和擴(kuò)展到許多任務(wù)變體。
![]()
步驟 2. 重新定位:將人類運(yùn)動(dòng)映射到機(jī)器人并約束條件
Atlas 并不是按照人類建造的。因此其擁有不同部位的比例、不同的關(guān)節(jié)限制、不同的驅(qū)動(dòng)方式。人類動(dòng)作無(wú)法1:1地完美復(fù)制。
波士頓動(dòng)力團(tuán)隊(duì)需要指導(dǎo)Atlas虛擬地匹配動(dòng)作,因?yàn)樗纳眢w與人類不同。
重新定位是將動(dòng)作變成機(jī)器人可用的一種形式:
對(duì)齊框架和關(guān)節(jié)運(yùn)動(dòng)
執(zhí)行關(guān)節(jié)限值和平衡約束
將人類意圖轉(zhuǎn)化為機(jī)器人軌跡
![]()
步驟 3. 在模擬中大規(guī)模訓(xùn)練:成千上萬(wàn)的虛擬機(jī)器人,快速迭代
通過(guò)使用Xsens捕捉的精準(zhǔn)動(dòng)作捕捉數(shù)據(jù),波士頓動(dòng)力團(tuán)隊(duì)在模擬中擴(kuò)展學(xué)習(xí),在該步驟中有超過(guò)4000個(gè)數(shù)字Atlas機(jī)器人在六小時(shí)內(nèi)并行訓(xùn)練。
團(tuán)隊(duì)還為模擬添加了諸如光滑的地板、斜坡和僵硬的關(guān)節(jié)等變量,迫使學(xué)習(xí)到的行為進(jìn)行適應(yīng),而不是記住一個(gè)單一的理想狀態(tài)。
模擬的核心優(yōu)勢(shì):
學(xué)習(xí)速度比實(shí)時(shí)更快
學(xué)習(xí)更加安全高效
在接真實(shí)觸硬件之前提高穩(wěn)定性
![]()
步驟 4. 部署到硬件:將訓(xùn)練過(guò)的技能部署到多臺(tái)機(jī)器人
當(dāng)學(xué)習(xí)過(guò)程完成后,其可以被直接轉(zhuǎn)移到真正的機(jī)器人上,值得注意的是,該過(guò)程可以重復(fù)進(jìn)行。
將技能擴(kuò)展到整個(gè)機(jī)器人陣列:
只需捕獲一次動(dòng)作數(shù)據(jù)
在模擬中訓(xùn)練和提高表現(xiàn)效果
將訓(xùn)練過(guò)的技能部署到整個(gè)機(jī)器人陣列
隨著環(huán)境的變化不斷迭代
![]()
Atlas 正在進(jìn)入真正的工廠
該案例以真實(shí)的制造背景為框架:波士頓動(dòng)力公司被邀請(qǐng)?jiān)诂F(xiàn)代汽車位于薩凡納的新工廠展示Atlas的第一次真正的戶外測(cè)試。
工廠本身已經(jīng)高度自動(dòng)化,擁有1000多臺(tái)機(jī)器人和近1500名員工,Atlas被定位為下一步:一個(gè)用于不值得定制自動(dòng)化的任務(wù)的靈活工人。
使用Xsens動(dòng)作捕捉進(jìn)行捕獲→重新定位→模擬→部署循環(huán)的競(jìng)爭(zhēng)優(yōu)勢(shì):
更快的新工作流程任務(wù)處理時(shí)間
更少“一次性”機(jī)器人程序
在現(xiàn)實(shí)世界的變異性下表現(xiàn)更好
如果您正在為工業(yè)環(huán)境打造人形機(jī)器人,Xsens動(dòng)作捕捉技術(shù)將成為連接人類靈活性與可擴(kuò)展的機(jī)器人學(xué)習(xí)的全新紐帶。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.