原文發(fā)表于《科技導(dǎo)報(bào)》2025 年第20 期 《 非結(jié)構(gòu)化環(huán)境下人形機(jī)器人行走規(guī)劃與控制 》
人形機(jī)器人因具有人體相似的形態(tài)與運(yùn)動(dòng)能力,被廣泛認(rèn)為是未來(lái)服務(wù)、救援與工業(yè)應(yīng)用的潛在核心裝備,但在非結(jié)構(gòu)化環(huán)境中實(shí)現(xiàn)穩(wěn)定可靠的行走仍具有顯著挑戰(zhàn)。《科技導(dǎo)報(bào)》邀請(qǐng)香港理工大學(xué)航空及民航工程學(xué)系曹屹峰、清華大學(xué)智能綠色車輛與交通全國(guó)重點(diǎn)實(shí)驗(yàn)室曹東璞等撰文,文章綜述了近年來(lái)在人形機(jī)器人行走規(guī)劃與控制方面的研究進(jìn)展,系統(tǒng)梳理了典型方法的核心思想與實(shí)現(xiàn)框架,討論了提升環(huán)境適應(yīng)性與動(dòng)態(tài)穩(wěn)定性的關(guān)鍵技術(shù)瓶頸,展望了未來(lái)在多模態(tài)感知融合、學(xué)習(xí)與控制協(xié)同優(yōu)化、全身運(yùn)動(dòng)技能學(xué)習(xí)及安全性保障等方面的發(fā)展趨勢(shì),并對(duì)相關(guān)技術(shù)的標(biāo)準(zhǔn)化與大規(guī)模應(yīng)用提出了建議。
人形機(jī)器人作為最接近人類形態(tài)與運(yùn)動(dòng)方式的自主系統(tǒng),一直被認(rèn)為是未來(lái)人工智能與機(jī)器人技術(shù)的重要方向。然而,要實(shí)現(xiàn)人形機(jī)器人在非結(jié)構(gòu)化環(huán)境下的穩(wěn)定行走依然面臨重大挑戰(zhàn)。人行機(jī)器人需要解決的問(wèn)題具體可以分為:感知、定位、規(guī)劃與控制4個(gè)子任務(wù)(圖1)。
![]()
圖1 人行機(jī)器人行走的子任務(wù)拆解
總體而言,人形機(jī)器人行走的規(guī)劃與控制領(lǐng)域的研究大致經(jīng)歷了3個(gè)階段:
(1)早期階段。以簡(jiǎn)化動(dòng)力學(xué)為核心,關(guān)注基本的平衡保持與周期步態(tài)生成。
(2)發(fā)展階段。引入優(yōu)化與預(yù)測(cè)控制,逐步解決非平地行走、擾動(dòng)恢復(fù)等問(wèn)題。
(3)新興階段。借助深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí),推動(dòng)感知、規(guī)劃與控制的融合,實(shí)現(xiàn)端到端或混合式框架。
我們的研究將圍繞規(guī)劃方法、控制方法以及將感知與規(guī)劃或感知與控制等不同模塊進(jìn)行深度結(jié)合的混合式及感知規(guī)劃與控制一體化的端到端算法3個(gè)方面,梳理近年來(lái)人形機(jī)器人在非結(jié)構(gòu)化環(huán)境下行走的研究進(jìn)展,并總結(jié)存在的瓶頸與未來(lái)的發(fā)展方向。
1 行走規(guī)劃算法研究進(jìn)展
在人形機(jī)器人研究中,行走規(guī)劃承擔(dān)著連接高層任務(wù)需求與底層控制執(zhí)行的橋梁作用。隨著研究的深入,行走規(guī)劃逐漸形成了自上而下的多層次框架:全局路徑規(guī)劃負(fù)責(zé)大范圍的導(dǎo)航?jīng)Q策,落足點(diǎn)與步態(tài)序列規(guī)劃確保與環(huán)境交互的可行性,而軌跡優(yōu)化則決定了具體的動(dòng)態(tài)表現(xiàn),這些規(guī)劃方法之間的關(guān)系如圖2所示。
![]()
圖2 非結(jié)構(gòu)化環(huán)境下人形機(jī)器人行走規(guī)劃方法的分類
1.1 全局及局部步態(tài)規(guī)劃
在人形機(jī)器人面臨的復(fù)雜環(huán)境中,首先需要確定一條從起點(diǎn)到目標(biāo)點(diǎn)的可行路徑。落足點(diǎn)規(guī)劃決定了機(jī)器人如何與環(huán)境發(fā)生接觸,是確保運(yùn)動(dòng)穩(wěn)定性與安全性的核心。
1)基于幾何求解的規(guī)劃方法。
早期研究多借鑒移動(dòng)機(jī)器人領(lǐng)域的經(jīng)典方法,如基于柵格的A*算法,以及基于采樣的快速隨機(jī)樹(shù)(RRT)與其改進(jìn)型RRT*。早期研究采用幾何規(guī)則來(lái)選擇落足點(diǎn),例如確保下一步落腳點(diǎn)位于支撐多邊形內(nèi)并滿足一定的步幅約束。這類方法簡(jiǎn)單高效,但往往對(duì)環(huán)境復(fù)雜性仍然考慮不足。同時(shí),這些方法能夠在二維或三維地圖上高效搜索路徑,適合用于靜態(tài)環(huán)境中的全局導(dǎo)航。
2)考慮動(dòng)力學(xué)約束的規(guī)劃方法。
單純的幾何路徑并不能保證人形機(jī)器人在實(shí)際執(zhí)行時(shí)的可行性。其原因在于:路徑可能要求機(jī)器人采取過(guò)于極端的步態(tài),超出動(dòng)力學(xué)極限。近年來(lái),部分研究嘗試將動(dòng)力學(xué)約束直接引入路徑搜索過(guò)程,在A*或RRT的啟發(fā)式函數(shù)中加入“步態(tài)可行性”或“能量消耗”來(lái)改進(jìn)這類方法。這類方法進(jìn)一步結(jié)合動(dòng)力學(xué)約束與能耗評(píng)估,實(shí)現(xiàn)了更接近實(shí)際可執(zhí)行的落足點(diǎn)序列。同時(shí)這類方法在路徑生成階段就考慮了機(jī)器人身體特性,從而減少了后續(xù)落足點(diǎn)規(guī)劃的沖突。
3)分層式步態(tài)規(guī)劃。
由于環(huán)境往往存在不確定性和動(dòng)態(tài)變化,離線生成的路徑無(wú)法長(zhǎng)期有效。為解決這一問(wèn)題,研究人員提出了分層路徑規(guī)劃的思路:全局層負(fù)責(zé)粗粒度的路徑生成,而局部層在執(zhí)行過(guò)程中進(jìn)行實(shí)時(shí)修正。這種方式在保持全局目標(biāo)一致性的同時(shí),提升了對(duì)未知環(huán)境的適應(yīng)性。分層式結(jié)構(gòu)保證了規(guī)劃的實(shí)時(shí)性及當(dāng)前規(guī)劃的可行性。
4)學(xué)習(xí)輔助的步態(tài)規(guī)劃。
近年來(lái),深度學(xué)習(xí)被引入落足點(diǎn)規(guī)劃。這類方法的優(yōu)勢(shì)在于能夠?qū)W習(xí)復(fù)雜地形特征,但也存在泛化能力和訓(xùn)練樣本依賴的問(wèn)題。
總體而言,落足點(diǎn)規(guī)劃已從“基于幾何的快速方案”發(fā)展到“優(yōu)化與學(xué)習(xí)結(jié)合的高精度方案”。在保證穩(wěn)定性的同時(shí),更加強(qiáng)調(diào)環(huán)境適應(yīng)性與實(shí)時(shí)性。
1.2 運(yùn)動(dòng)軌跡規(guī)劃
落足點(diǎn)序列確定后,機(jī)器人需要生成符合動(dòng)力學(xué)約束的運(yùn)動(dòng)軌跡,為下層控制器提供參考軌跡,通常生成的參考軌跡為質(zhì)心參考軌跡及足部軌跡。生成的軌跡需要滿足實(shí)時(shí)性、動(dòng)力學(xué)約束等條件。
1)基于簡(jiǎn)化模型的軌跡優(yōu)化。
早期的軌跡優(yōu)化方法致力于使用簡(jiǎn)化動(dòng)力學(xué)模型生成特定參數(shù)的參考軌跡,最常見(jiàn)的框架是基于零力矩點(diǎn)(ZMP)與線性倒立擺模型(LIPM)的軌跡生成方法,如通過(guò)控制質(zhì)心在支撐多邊形內(nèi)的運(yùn)動(dòng)軌跡,機(jī)器人能夠保持穩(wěn)定的周期步態(tài)。一些研究旨在選取更有效參數(shù)的軌跡,或使用更精確的簡(jiǎn)化模型。
2)軌跡修正與在線調(diào)整。
部分研究在軌跡執(zhí)行過(guò)程中動(dòng)態(tài)修正,例如實(shí)時(shí)調(diào)整擺動(dòng)腿的軌跡,以避免與障礙物碰撞;或通過(guò)時(shí)間重參數(shù)化改變步態(tài)節(jié)奏,從而提升對(duì)突發(fā)擾動(dòng)的容忍度。相比于對(duì)自身狀態(tài)以及外部擾動(dòng)進(jìn)行建模,Nguyen等使用狀態(tài)庫(kù)來(lái)應(yīng)對(duì)外部不確定環(huán)境,采用具有快速檢索和插值的周期性步態(tài)庫(kù),使規(guī)劃者能夠動(dòng)態(tài)響應(yīng)不可預(yù)測(cè)的步進(jìn)表面。這類方法通過(guò)對(duì)軌跡的動(dòng)態(tài)調(diào)整,提升了與環(huán)境的動(dòng)態(tài)交互能力與行走穩(wěn)定性。
3)數(shù)據(jù)驅(qū)動(dòng)的軌跡規(guī)劃。
在復(fù)雜環(huán)境下,單純的模型可能無(wú)法準(zhǔn)確描述系統(tǒng)動(dòng)力學(xué)。為此,研究者利用數(shù)據(jù)驅(qū)動(dòng)方法進(jìn)行補(bǔ)償。眾多研究者利用數(shù)據(jù)驅(qū)動(dòng)的方法來(lái)實(shí)時(shí)修正外部擾動(dòng)下的質(zhì)心或擺腿軌跡。除了應(yīng)對(duì)外部干擾之外,也有研究者使用數(shù)據(jù)驅(qū)動(dòng)的方法來(lái)應(yīng)對(duì)軌跡規(guī)劃時(shí)的地形不確定性。
軌跡優(yōu)化不僅保證了運(yùn)動(dòng)的平穩(wěn)與穩(wěn)定,還為機(jī)器人提供了面對(duì)環(huán)境不確定性時(shí)的快速恢復(fù)能力。未來(lái)的研究可能會(huì)更多關(guān)注如何在保持實(shí)時(shí)性的前提下,結(jié)合高維感知信息生成更加智能的軌跡。
1.3 小結(jié)
行走規(guī)劃方法正從傳統(tǒng)的幾何搜索逐步發(fā)展為兼顧動(dòng)力學(xué)約束與環(huán)境適應(yīng)性的多層次框架。全局路徑規(guī)劃為機(jī)器人提供了整體方向,落足點(diǎn)序列保證了局部可行性,而軌跡優(yōu)化則在執(zhí)行層面實(shí)現(xiàn)了動(dòng)態(tài)穩(wěn)定性。隨著深度學(xué)習(xí)和優(yōu)化技術(shù)的結(jié)合,未來(lái)的人形機(jī)器人有望在未知、復(fù)雜甚至動(dòng)態(tài)環(huán)境中實(shí)現(xiàn)更自然、更可靠的行走能力。
2 行走控制算法研究進(jìn)展
行走規(guī)劃與行走控制一般為上下層的關(guān)系,根據(jù)行走規(guī)劃提供的參考運(yùn)動(dòng)軌跡,控制方法決定了具體動(dòng)作實(shí)施。隨著技術(shù)發(fā)展,控制方法經(jīng)歷了從基于簡(jiǎn)化模型的平衡控制,到優(yōu)化驅(qū)動(dòng)的全身控制(WBC),再到學(xué)習(xí)驅(qū)動(dòng)的自適應(yīng)與混合控制的演進(jìn)(圖3)。
![]()
圖3 非結(jié)構(gòu)化環(huán)境下人形機(jī)器人行走控制方法的分類
2.1 基于簡(jiǎn)化模型的行走控制
最經(jīng)典的行走控制方法選擇將機(jī)器人的多剛體動(dòng)力學(xué)模型簡(jiǎn)化為一個(gè)簡(jiǎn)化模型如線性倒立擺模型(LIPM)對(duì)機(jī)器人進(jìn)行控制。然而,LIPM假設(shè)支撐腳與地面始終完全接觸,忽略了踝關(guān)節(jié)與上身運(yùn)動(dòng)的影響。為此,研究人員引入了多種擴(kuò)展。例如,基于Pratt等提出的捕獲點(diǎn)(CP)理論,對(duì)現(xiàn)有的基于簡(jiǎn)化模型的控制方法進(jìn)行拓展。
除去適應(yīng)外力擾動(dòng),這一方法也被用于適應(yīng)復(fù)雜地形。除去引入捕獲點(diǎn)這一概念來(lái)增強(qiáng)行走控制的穩(wěn)定性,還有一部分研究人員嘗試對(duì)簡(jiǎn)化模型進(jìn)行拓展,以提升其在非結(jié)構(gòu)化環(huán)境下的適應(yīng)能力。相比于對(duì)簡(jiǎn)化模型進(jìn)行拓展,也有研究人員選擇對(duì)簡(jiǎn)化模型進(jìn)行參數(shù)優(yōu)化。與引入捕獲點(diǎn)概念類似,也有研究者將質(zhì)心動(dòng)量納入控制變量,以更真實(shí)地描述機(jī)器人整體動(dòng)力學(xué)。
簡(jiǎn)化模型方法在計(jì)算復(fù)雜度與控制穩(wěn)定性之間取得了一定平衡,使人形機(jī)器人能夠完成較為復(fù)雜的基本行走任務(wù),并在早期研究中發(fā)揮了重要作用。然而,這類方法也存在顯著局限:
首先,它們通常依賴于低維近似模型,難以全面刻畫(huà)高自由度人形機(jī)器人全身的動(dòng)力學(xué)耦合關(guān)系;
其次,當(dāng)機(jī)器人處于強(qiáng)擾動(dòng)或非結(jié)構(gòu)化環(huán)境時(shí),基于簡(jiǎn)化模型的假設(shè)往往失效,導(dǎo)致系統(tǒng)穩(wěn)定性受限;
最后,簡(jiǎn)化模型控制無(wú)法有效利用機(jī)器人冗余的關(guān)節(jié)自由度,從而難以實(shí)現(xiàn)行走與操作等多任務(wù)的協(xié)同執(zhí)行。
2.2 全身運(yùn)動(dòng)控制
全身控制的核心思想是在完整動(dòng)力學(xué)模型的框架下,同時(shí)協(xié)調(diào)多個(gè)任務(wù)目標(biāo),例如維持質(zhì)心平衡、實(shí)現(xiàn)步態(tài)跟蹤以及完成上肢操作等。與依賴簡(jiǎn)化模型的方法不同,WBC強(qiáng)調(diào)通過(guò)引入機(jī)器人全身的動(dòng)力學(xué)約束,以優(yōu)化求解的方式在不同任務(wù)之間實(shí)時(shí)分配控制輸入,從而在確保物理可行性的同時(shí)最大化任務(wù)完成度。
現(xiàn)代WBC通常將控制問(wèn)題表述為一個(gè)約束優(yōu)化問(wèn)題,其中任務(wù)目標(biāo)包括保持質(zhì)心穩(wěn)定、足部軌跡跟蹤以及上肢姿態(tài)控制等;約束條件涵蓋關(guān)節(jié)力矩范圍、接觸力摩擦錐以及完整的動(dòng)力學(xué)方程;而在具體的數(shù)值求解方面,二次規(guī)劃(QP)成為最常見(jiàn)的工具。該方法通過(guò)在實(shí)時(shí)優(yōu)化過(guò)程中平衡不同任務(wù)的優(yōu)先級(jí),使人形機(jī)器人能夠在復(fù)雜環(huán)境下展現(xiàn)出多任務(wù)協(xié)同與動(dòng)態(tài)穩(wěn)定性的能力。
在全身控制中,任務(wù)間往往存在沖突。例如,保持平衡與完成操作任務(wù)可能無(wú)法同時(shí)滿足。為此,研究者提出了分層全身控制(HWBC),將不同控制目標(biāo)進(jìn)行分層式疊加,通過(guò)優(yōu)先級(jí)機(jī)制保證關(guān)鍵任務(wù)優(yōu)先執(zhí)行。除了優(yōu)化踝關(guān)節(jié)驅(qū)動(dòng)扭矩,也有研究嘗試優(yōu)化接觸力軌跡或質(zhì)心軌跡。
盡管WBC在實(shí)現(xiàn)多任務(wù)協(xié)調(diào)和動(dòng)力學(xué)一致性方面展現(xiàn)出顯著優(yōu)勢(shì),但在實(shí)際應(yīng)用中仍面臨諸多挑戰(zhàn)。
首先,WBC需要在實(shí)時(shí)條件下求解高維的優(yōu)化問(wèn)題,這對(duì)計(jì)算資源提出了極高的要求,限制了其在嵌入式平臺(tái)上的部署。
其次,控制框架通常依賴精確的動(dòng)力學(xué)模型,而在真實(shí)機(jī)器人中,不可避免地存在模型與實(shí)際執(zhí)行器之間的偏差,這會(huì)導(dǎo)致控制性能下降。
最后,在高度動(dòng)態(tài)的非結(jié)構(gòu)化環(huán)境中,如何在保持穩(wěn)定性的同時(shí)兼顧復(fù)雜任務(wù)執(zhí)行,仍是一個(gè)難以完全解決的問(wèn)題。
2.3 強(qiáng)化學(xué)習(xí)控制
近年來(lái),深度強(qiáng)化學(xué)習(xí)(DRL)在機(jī)器人控制領(lǐng)域展現(xiàn)出巨大的發(fā)展?jié)摿ΑRL借助深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)大表示能力,通過(guò)與環(huán)境的反復(fù)交互直接學(xué)習(xí)狀態(tài)與動(dòng)作的映射關(guān)系,從而獲得控制策略。更為重要的是,DRL在面對(duì)復(fù)雜、非線性和高度不確定的動(dòng)力學(xué)系統(tǒng)時(shí)表現(xiàn)出較強(qiáng)的適應(yīng)性與魯棒性。因此,DRL的引入不僅為人形機(jī)器人突破傳統(tǒng)控制框架的局限提供了新的思路,也為其在非結(jié)構(gòu)化環(huán)境中的穩(wěn)定行走與任務(wù)執(zhí)行開(kāi)辟了新的研究方向。
除去利用強(qiáng)化學(xué)習(xí)學(xué)習(xí)簡(jiǎn)單的行走控制策略,也有研究者嘗試?yán)脧?qiáng)化學(xué)習(xí)學(xué)習(xí)特殊或者多樣化的行走技能。除了使用純粹的深度強(qiáng)化學(xué)習(xí)構(gòu)建控制策略,也有研究者探索嘗試使用學(xué)習(xí)的方法增強(qiáng)優(yōu)化控制算法,即將使用不同方法的模塊進(jìn)行結(jié)合的混合式框架。
這類方法也面臨諸多限制:
其一,訓(xùn)練往往需要大量樣本,尤其在真實(shí)機(jī)器人上收集數(shù)據(jù)成本極高;
其二,仿真與現(xiàn)實(shí)之間存在不可忽視的差距,導(dǎo)致策略在實(shí)際部署時(shí)泛化能力不足;
其三,學(xué)習(xí)策略普遍缺乏可解釋性和嚴(yán)格的安全保證,難以直接應(yīng)用于高風(fēng)險(xiǎn)任務(wù)場(chǎng)景。
2.4 小結(jié)
總體而言,人形機(jī)器人控制方法的發(fā)展大致經(jīng)歷了3個(gè)重要階段。
首先,基于簡(jiǎn)化模型的方法,如線性倒立擺模型與零力矩點(diǎn)控制,為實(shí)現(xiàn)基本的動(dòng)態(tài)平衡和周期步態(tài)生成奠定了理論與技術(shù)基礎(chǔ)。
其次,隨著優(yōu)化技術(shù)與計(jì)算能力的提升,全身控制逐漸成為主流。
然而,全身控制的實(shí)時(shí)性要求與對(duì)模型精度的依賴仍然限制了其在非結(jié)構(gòu)化環(huán)境中的魯棒性。近年來(lái),學(xué)習(xí)驅(qū)動(dòng)與混合控制方法開(kāi)始興起,深度強(qiáng)化學(xué)習(xí)憑借其強(qiáng)大的自適應(yīng)能力,為機(jī)器人在未知環(huán)境中的穩(wěn)健運(yùn)動(dòng)提供了新的可能。與此同時(shí),模型驅(qū)動(dòng)與學(xué)習(xí)驅(qū)動(dòng)的結(jié)合成為新的研究方向,既能利用模型方法的可解釋性與安全性,又能發(fā)揮學(xué)習(xí)方法在復(fù)雜場(chǎng)景下的靈活性與泛化能力。
3 協(xié)同式架構(gòu)
近年來(lái),相比于單獨(dú)設(shè)計(jì),調(diào)整規(guī)劃或控制等模塊,有研究者開(kāi)始嘗試設(shè)計(jì)整體式框架,通過(guò)將不同模塊緊密融合實(shí)現(xiàn)整體優(yōu)化。趨勢(shì)主要體現(xiàn)在3方面:
其一,將感知、規(guī)劃與控制整合到統(tǒng)一的框架中;
其二,引入強(qiáng)化學(xué)習(xí)控制甚至感知規(guī)劃或感知規(guī)劃控制一體化的端到端策略,突破傳統(tǒng)模塊化架構(gòu)的局限;
其三,強(qiáng)調(diào)硬件平臺(tái)與算法的協(xié)同設(shè)計(jì)。
3.1 感知—控制協(xié)同架構(gòu)的發(fā)展
傳統(tǒng)的人形機(jī)器人行走系統(tǒng)大多采用分層架構(gòu):感知模塊生成環(huán)境模型,規(guī)劃模塊輸出路徑與步態(tài),控制模塊再跟蹤執(zhí)行。然而這種分離式架構(gòu)存在信息傳遞延遲、誤差累積以及模塊間不一致的問(wèn)題。為解決這一瓶頸,研究者提出一體化框架,將感知、規(guī)劃與控制等模塊之間進(jìn)行一定有機(jī)結(jié)合。
3.2 感知—規(guī)劃—控制協(xié)同架構(gòu)的發(fā)展
除了將部分模塊進(jìn)行緊密結(jié)合,近年也有研究者嘗試將感知、規(guī)劃與控制結(jié)合作為一體式的控制框架,使僅通過(guò)單一模塊,讓機(jī)器人可以在環(huán)境中自主到達(dá)指定的目標(biāo)地點(diǎn),形成真正的“端到端”架構(gòu)。
3.3 小結(jié)
端到端方法在機(jī)器人行走中的應(yīng)用仍處于不斷演進(jìn)階段,其發(fā)展趨勢(shì)主要體現(xiàn)在3個(gè)方面。
首先,模型與學(xué)習(xí)的深度融合將成為主流方向:研究者嘗試在端到端框架中引入可微分物理約束或優(yōu)化層,使得控制器既具備端到端學(xué)習(xí)的靈活性,又保持物理一致性與穩(wěn)定性。
其次,多模態(tài)感知的整合將進(jìn)一步提升端到端架構(gòu)的適應(yīng)性,視覺(jué)、力覺(jué)和慣性傳感等信息的融合有助于機(jī)器人在更加復(fù)雜和動(dòng)態(tài)的環(huán)境中實(shí)現(xiàn)魯棒控制。
最后,仿真到現(xiàn)實(shí)的遷移仍是亟需解決的關(guān)鍵問(wèn)題,通過(guò)域自適應(yīng)、對(duì)抗訓(xùn)練和真實(shí)機(jī)器人上的小樣本微調(diào),有望縮小仿真與現(xiàn)實(shí)之間的差距。
4 未來(lái)展望
未來(lái)的發(fā)展趨勢(shì)將不再局限于單一算法的改進(jìn),而是更加強(qiáng)調(diào)跨學(xué)科的深度融合,尤其是與人工智能、硬件平臺(tái)和標(biāo)準(zhǔn)體系的結(jié)合,以下4個(gè)方向可能成為未來(lái)研究的重點(diǎn)。
4.1 規(guī)劃控制與大語(yǔ)言模型及視覺(jué)語(yǔ)言模型的深度結(jié)合
隨著大語(yǔ)言模型(LLM)和視覺(jué)語(yǔ)言模型(VLM)的快速演進(jìn),人形機(jī)器人在任務(wù)理解與語(yǔ)義感知方面將迎來(lái)新突破。LLM與VLM的引入有望讓機(jī)器人具備更接近人類的語(yǔ)義推理與環(huán)境理解能力。這種能力不僅能夠提升機(jī)器人在復(fù)雜任務(wù)場(chǎng)景中的適應(yīng)性,還能夠顯著改善人機(jī)交互體驗(yàn),使非專業(yè)用戶也能通過(guò)自然語(yǔ)言與機(jī)器人進(jìn)行高效溝通。未來(lái),如何將基于語(yǔ)義理解的規(guī)劃和控制與傳統(tǒng)動(dòng)力學(xué)約束有機(jī)結(jié)合,將成為實(shí)現(xiàn)智能化行走控制的重要研究方向。
4.2 硬件—算法的協(xié)同化發(fā)展
人形機(jī)器人在實(shí)際應(yīng)用中往往受到算力、能耗和執(zhí)行器性能的制約,因此,未來(lái)的研究必須更加注重硬件與算法的協(xié)同優(yōu)化。
一方面,執(zhí)行器與傳感器技術(shù)的進(jìn)步將為復(fù)雜算法的部署提供堅(jiān)實(shí)硬件基礎(chǔ)。
另一方面,算法設(shè)計(jì)也需要更加貼合硬件特性,從而延長(zhǎng)機(jī)器人的續(xù)航并提升整體能效。
此外,硬件與算法的協(xié)同發(fā)展不僅體現(xiàn)在計(jì)算和能耗的平衡,還包括機(jī)器人結(jié)構(gòu)布局與控制策略的共同優(yōu)化。這種雙向促進(jìn)的模式有望成為未來(lái)人形機(jī)器人設(shè)計(jì)與控制的核心理念。
4.3 機(jī)器人機(jī)構(gòu)與傳感器的發(fā)展
除了算法與硬件協(xié)同,機(jī)器人本體結(jié)構(gòu)與傳感系統(tǒng)的革新同樣是提升行走能力的關(guān)鍵。未來(lái),輕量化與高強(qiáng)度材料的應(yīng)用將顯著降低機(jī)器人能耗并提升耐久性,而柔性關(guān)節(jié)與順應(yīng)性機(jī)構(gòu)的引入則有助于機(jī)器人在非結(jié)構(gòu)化地形中更好地吸收沖擊、維持穩(wěn)定。這些機(jī)構(gòu)與傳感器的持續(xù)演進(jìn)將不僅提升機(jī)器人在單一任務(wù)中的表現(xiàn),還將拓寬其在多任務(wù)與復(fù)雜環(huán)境下的適用性。
4.4 通用數(shù)據(jù)集與評(píng)價(jià)體系的發(fā)展
未來(lái),建立開(kāi)放且標(biāo)準(zhǔn)化的數(shù)據(jù)集與評(píng)價(jià)體系顯得尤為重要。這類數(shù)據(jù)集應(yīng)覆蓋多樣化的行走場(chǎng)景,包括不規(guī)則地形、外部擾動(dòng)、障礙物分布以及多任務(wù)操作需求;而評(píng)價(jià)體系則應(yīng)在穩(wěn)定性、能效、任務(wù)完成率和安全性等多維度上進(jìn)行全面考量。統(tǒng)一的數(shù)據(jù)與評(píng)測(cè)標(biāo)準(zhǔn)不僅能夠促進(jìn)學(xué)術(shù)界在算法迭代中的公平比較,也有助于推動(dòng)工業(yè)界快速采納先進(jìn)方法,實(shí)現(xiàn)從實(shí)驗(yàn)室到應(yīng)用的平滑過(guò)渡。
5 結(jié)論
人形機(jī)器人行走研究在過(guò)去幾十年取得了顯著進(jìn)展,從早期的簡(jiǎn)化模型控制到近年的全身優(yōu)化與學(xué)習(xí)驅(qū)動(dòng)方法,技術(shù)體系逐漸形成了較為完整的框架。以“非結(jié)構(gòu)化環(huán)境下的人形機(jī)器人行走規(guī)劃與控制”為核心視角,我們綜述了規(guī)劃方法、控制方法以及2者的融合與發(fā)展趨勢(shì),并在此基礎(chǔ)上進(jìn)行總結(jié)與展望。在技術(shù)層面,行走規(guī)劃與控制方法不斷演進(jìn),當(dāng)前人形機(jī)器人行走研究已經(jīng)形成了從規(guī)劃、控制到融合的完整方法體系,并正沿著高魯棒性、自適應(yīng)與實(shí)用化的方向快速發(fā)展。
展望未來(lái),人形機(jī)器人研究將不僅聚焦于單一的算法或硬件突破,而是朝著跨領(lǐng)域、跨層次的綜合發(fā)展方向邁進(jìn)。通過(guò)與大模型的結(jié)合、硬件—算法協(xié)同優(yōu)化、機(jī)構(gòu)與傳感器的演進(jìn),以及統(tǒng)一標(biāo)準(zhǔn)體系的建立,人形機(jī)器人有望在非結(jié)構(gòu)化環(huán)境中實(shí)現(xiàn)更高水平的自主性與智能化,真正走向?qū)嵱没c大規(guī)模應(yīng)用。
本文作者:曹屹峰、何俊鵬、李炳賢、范麗麗、田永林、文偉松、曹東璞
作者簡(jiǎn)介:曹屹峰,香港理工大學(xué)航空及民航工程學(xué)系,博士研究生,研究方向?yàn)槿诵螜C(jī)器人、機(jī)器人控制、自動(dòng)駕駛;曹東璞(通信作者),清華大學(xué)智能綠色車輛與交通全國(guó)重點(diǎn)實(shí)驗(yàn)室,教授,研究方向?yàn)轳{駛員認(rèn)知、網(wǎng)聯(lián)自動(dòng)駕駛。
文章來(lái) 源 : 曹屹峰, 何俊鵬, 李炳賢, 等. 非結(jié)構(gòu)化環(huán)境下人形機(jī)器人行走規(guī)劃與控制[J]. 科技導(dǎo)報(bào), 2025, 43(20): 93?104 .
本文轉(zhuǎn)載自《科技導(dǎo)報(bào)》微信公眾號(hào)
《物理》50年精選文章
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.