機器人摔倒是個大難題,尤其是“頭重腳輕”的機器人,一不小心就可能造成昂貴的損傷。過去,為了防止摔倒,工程師們要么限制其性能,讓它畏首畏尾;要么任其“硬著陸”。這些方法都治標不治本。
但是,如果換個思路呢?
與其想盡辦法避免摔倒,不如把“摔倒”本身,變成一門可以學習和控制的藝術。
就在最近,來自迪士尼研究院(Disney Research)的一項最新研究,徹底顛覆了我們對機器人摔倒的認知。他們提出了一種名為“機器人速成班:學習柔軟且風格化的摔倒”(Robot Crash Course: Learning Soft and Stylized Falling)的全新方法。
這項研究的核心思想是:讓機器人不僅能摔得“軟”,最大限度減少沖擊和損傷,還能摔得“帥”,在倒地后擺出一個用戶指定的、充滿藝術感的姿勢。
想象一下,一個機器人在舞臺上出現(xiàn)失誤,它沒有僵硬地倒下,而是順勢一個翻滾,最后以一個帥氣的臥倒姿勢結(jié)束,不僅沒出糗,反而秀了一波操作。這簡直是把Bug玩成了絕活!
![]()
這項研究成果,不僅能讓機器人在娛樂、影視等行業(yè)大放異彩,更能為機器人的安全和快速恢復提供全新的解決方案。一個能控制自己摔倒姿勢的機器人,可以選擇一個最容易站起來的姿勢倒下,大大縮短了“宕機”時間。
那么,迪士尼的科學家們究竟是如何教會機器人這項“摔跤神功”的呢?
▍“摔跤”的藝術:如何讓機器人摔得又軟又帥?
這項技術的靈魂,在于一個精心設計的強化學習(Reinforcement Learning)框架。簡單來說,就是讓AI在模擬環(huán)境中不斷地“摔跤”,并通過一個復雜的“獎勵函數(shù)”來引導它學習。
這個獎勵函數(shù)就像一位嚴厲又貼心的教練,它同時關注兩個核心目標:沖擊最小化姿態(tài)跟蹤
首先,是“軟著陸”的目標。為了讓機器人摔得輕,研究人員在獎勵函數(shù)中設置了懲罰項。機器人身體的任何部分與地面發(fā)生碰撞,只要產(chǎn)生的接觸力過大,AI就會被扣分。不僅如此,為了保護那些“嬌貴”的核心部件,研究人員還引入了“身體部位敏感度權重”。
比如,他們可以設定頭部的敏感度權重是4.0,肩膀是3.0,而相對皮實的腿部是1.0。這樣一來,AI在訓練中就會學到一個至關重要的原則:“摔哪都行,就是別摔到頭!”它會下意識地用手臂、身體等其他部位來緩沖,保護好最關鍵的部分。
其次,是“風格化”的目標。這部分的目標是讓機器人最終能停在用戶指定的姿勢上。在訓練中,AI會得到一個目標結(jié)束姿勢(end pose),它的任務就是在摔倒的最后,讓自己的身體姿態(tài)盡可能地接近這個目標。無論是躺著、趴著,還是側(cè)臥著,只要你敢想,AI就敢學。
![]()
當然,這兩個目標有時是相互沖突的。又要摔得輕,又要姿勢帥,怎么平衡?
迪士尼的研究人員設計了一個巧妙的時間調(diào)制機制。在摔倒的初始階段,獎勵函數(shù)會優(yōu)先考慮沖擊最小化,讓機器人集中精力“保命”。隨著機器人逐漸穩(wěn)定下來,姿態(tài)跟蹤的權重會慢慢增加,引導機器人平滑地過渡到最終的造型。整個過程一氣呵成,既安全又優(yōu)雅。
這個過程就像武術中的“受身”或柔道中的“UKEMI”技術,不是被動地摔倒,而是主動地利用滾動和身體姿態(tài)來化解沖擊力。只不過,機器人學會這一切,完全是通過AI自我探索和學習完成的。
▍海量姿勢從哪來?物理引擎“摔”出大數(shù)據(jù)
要訓練一個能適應各種摔倒情況和目標姿勢的通用模型,一個巨大的、多樣化的數(shù)據(jù)集是必不可少的。如果讓藝術家或工程師手動設計成千上萬個摔倒姿勢,那簡直是天方夜譚。
于是,研究團隊想出了一個絕妙的辦法:讓物理引擎自己“摔”出大數(shù)據(jù)!
他們利用了NVIDIA的Isaac Sim物理仿真平臺,這個平臺可以利用GPU進行大規(guī)模并行仿真,效率極高。具體步驟是這樣的:
1.隨機生成姿態(tài):在機器人的關節(jié)限制范圍內(nèi),隨機生成大量的身體姿態(tài),并剔除那些會自我碰撞的無效姿態(tài)。
2.模擬“自由落體”:將這些隨機姿態(tài)的機器人從一個很低的高度(比如4厘米)釋放,并鎖定其關節(jié)(即給予高增益的PD控制)。
3.記錄穩(wěn)定姿態(tài):讓機器人在仿真環(huán)境中自由翻滾、碰撞,直到它最終靜止下來。這個最終的、物理上穩(wěn)定的姿態(tài),就被記錄下來,作為一個合格的“目標結(jié)束姿勢”。
通過這種方式,他們可以高效地生成數(shù)以萬計的、符合物理規(guī)律的、靜態(tài)穩(wěn)定的摔倒姿勢。為了確保數(shù)據(jù)集的多樣性,他們還設計了一種機制來避免某些姿勢(比如仰面朝天)被過度采樣,從而保證了訓練數(shù)據(jù)的全面性。
這個基于物理仿真的采樣策略,是整個研究能夠成功的關鍵之一。它不僅解決了數(shù)據(jù)來源的難題,更保證了AI學習到的目標姿勢在現(xiàn)實世界中是“可行”“穩(wěn)定”的。有了這個龐大的姿勢庫,AI就能學會從任何初始摔倒狀態(tài),過渡到任何一個它見過的、或沒見過的目標姿勢,展現(xiàn)出驚人的泛化能力
實驗數(shù)據(jù)也證明了這一點。當研究人員只用10個藝術家設計的姿勢來訓練模型時,模型雖然能很好地復現(xiàn)這10個姿勢,但對于新的、未見過的姿勢就表現(xiàn)很差。而使用了大規(guī)模生成數(shù)據(jù)集訓練的模型,則無論是在已見還是未見的姿勢上,都表現(xiàn)出了強大的泛化性能和魯棒性。
▍從仿真到現(xiàn)實:真機實測效果炸裂
在仿真環(huán)境中表現(xiàn)出色,只是成功的一半。真正的考驗在于,這個在虛擬世界里練就“摔跤神功”的AI,能否在現(xiàn)實世界的真實機器人上復現(xiàn)出來?這就是所謂的Sim-to-Real挑戰(zhàn)。
研究團隊在一個定制的、高0.84米、重16.2公斤的雙足機器人上進行了實地測試。他們從藝術家設計的10個極具表現(xiàn)力的姿勢中選擇目標,然后用棍子等工具從不同方向推搡機器人,模擬各種突發(fā)的、不可預料的摔倒情況。
結(jié)果令人驚嘆!
![]()
與傳統(tǒng)的“零力矩”(癱軟)、“低增益”(阻尼)或“高增益”(僵硬)摔倒方式相比,搭載了新算法的機器人表現(xiàn)出了無與倫比的控制力。從上圖的仿真對比數(shù)據(jù)可以看出,新方法產(chǎn)生的最大沖擊力和平均沖擊力,相比其他方法都實現(xiàn)了斷崖式的下降,并且方差極小,意味著每次摔倒都非常穩(wěn)定可控。
在真實世界的實驗中,機器人面對外部推力,不再是直挺挺地倒下。它會迅速判斷情況,調(diào)整四肢,用一種流暢、可控的方式接觸地面,并在倒地后穩(wěn)穩(wěn)地停在預設的藝術造型上。
![]()
整個過程,機器人仿佛一個專業(yè)的特技演員,將一次潛在的“事故”變成了一場精彩的“表演”。更重要的是,在全部的真實世界實驗中,機器人毫發(fā)無傷,所有功能完好如初。這充分證明了該方法的有效性和實用性。
這項研究雖然目前還存在一些待完善之處,比如需要一個獨立的機制來判斷“何時應該啟動摔倒策略”,或者如何與摔倒后的“恢復站立”策略無縫銜接。但它無疑為機器人領域開辟了一個全新的方向。
未來,這項技術不僅可以用于娛樂行業(yè)的特技機器人,讓它們上演各種高難度、夸張的動作;也可以用于工業(yè)、救援等領域的機器人,讓它們在崎嶇地形中即使不慎摔倒,也能最大程度地自我保護,并快速恢復工作。
或許在不久的將來,當機器人再次摔倒在我們面前時,我們看到的將不再是笨拙和狼狽,而是一場充滿力量與美的“可控表演”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.