網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

那些看似簡(jiǎn)單的機(jī)器人“打架”背后有何精密的技術(shù)支撐

2025-08-29 07:06:43　來源: 創(chuàng)新文化促進(jìn)會(huì)

北京舉報(bào)

分享至

引言：當(dāng)格斗賽點(diǎn)燃科技圈

2025年的夏天，在上海世界人工智能大會(huì)（WAIC）的展臺(tái)上，宇樹G1的人形機(jī)器人，身戴拳擊手套，與另一臺(tái)機(jī)器人或真人對(duì)手展開激烈格斗。它時(shí)而迅猛出拳，時(shí)而側(cè)身閃避，動(dòng)作行云流水，即便被擊倒也能在數(shù)秒內(nèi)以一個(gè)漂亮的“鯉魚打挺”迅速起身，恢復(fù)戰(zhàn)斗姿態(tài)。現(xiàn)場(chǎng)觀眾人山人海，驚呼連連，仿佛科幻電影中的“機(jī)甲大戰(zhàn)”真實(shí)上演。

這場(chǎng)面并非孤例。在由中央廣播電視總臺(tái)主辦的《CMG世界機(jī)器人大賽》中，宇樹G1更是作為主角，上演了全球首場(chǎng)以人形機(jī)器人為主體的格斗競(jìng)技賽。這些曾經(jīng)只存在于想象中的場(chǎng)景，如今正以前所未有的速度變?yōu)楝F(xiàn)實(shí)。

然而，當(dāng)炫目的燈光和激烈的對(duì)抗落幕后，一個(gè)更深層次的問題浮出水面：這究竟是一場(chǎng)精心編排的“秀”，還是代表著機(jī)器人技術(shù)的一次本質(zhì)性飛躍？宇樹G1是如何在混亂的格斗中站穩(wěn)腳跟、看清對(duì)手并精準(zhǔn)出擊的？我們來探究從實(shí)驗(yàn)室走向擂臺(tái)，再?gòu)睦夼_(tái)走向現(xiàn)實(shí)的必經(jīng)之路。

第一部分：穩(wěn)如磐石 —— 動(dòng)態(tài)平衡的藝術(shù)與科學(xué)

對(duì)于一個(gè)人形機(jī)器人而言，一切高級(jí)功能的實(shí)現(xiàn)，都建立在動(dòng)態(tài)平衡這一地基之上。與擁有寬大底座的工業(yè)機(jī)械臂不同，G1僅靠?jī)芍荒_支撐約35公斤的體重，并在運(yùn)動(dòng)中持續(xù)對(duì)抗重力與慣性，這是它能夠行動(dòng)自如的首要前提，也是技術(shù)上最大的挑戰(zhàn)之一。

核心技術(shù)一：零力矩點(diǎn)（Zero Moment Point, ZMP）與全身控制

通俗理解： ZMP可以想象成機(jī)器人所有對(duì)地壓力匯聚而成的一個(gè)“合力點(diǎn)”。只要這個(gè)點(diǎn)始終保持在機(jī)器人雙腳（或單腳）構(gòu)成的支撐區(qū)域內(nèi)，機(jī)器人理論上就不會(huì)傾倒。

在格斗中，G1的每一個(gè)動(dòng)作——無論是出拳、踢腿還是閃避——都會(huì)導(dǎo)致其全身質(zhì)心（Center of Mass, CoM）的劇烈變化。其內(nèi)置的智能平衡算法，核心任務(wù)之一就是實(shí)時(shí)計(jì)算并控制ZMP。當(dāng)G1揮出右拳時(shí)，算法會(huì)瞬間計(jì)算出如何調(diào)動(dòng)其左腿、腰部乃至左臂的29個(gè)關(guān)節(jié)，協(xié)同產(chǎn)生一個(gè)反向的力矩，確保ZMP點(diǎn)穩(wěn)定地保持在雙腳之間。

這種基于模型的全身控制（Whole-Body Control）策略，使得G1的動(dòng)作不再是各個(gè)關(guān)節(jié)的獨(dú)立運(yùn)動(dòng)，而是一個(gè)高度協(xié)調(diào)的有機(jī)整體，這是其動(dòng)作看起來“行云流水”而非僵硬機(jī)械的根本原因。

核心技術(shù)二：模型預(yù)測(cè)控制（Model Predictive Control, MPC）與抗擾動(dòng)能力

如果說ZMP是保證“下一步不摔”的戰(zhàn)術(shù)，那么MPC就是“深謀遠(yuǎn)慮”的戰(zhàn)略。人類拳手在對(duì)戰(zhàn)時(shí)，會(huì)預(yù)判對(duì)手的攻擊并提前做出反應(yīng)。MPC賦予了G1類似的能力。

工作原理： MPC基于G1精確的動(dòng)力學(xué)模型，在每個(gè)控制周期內(nèi)，它會(huì)預(yù)測(cè)未來一小段時(shí)間內(nèi)數(shù)千種可能的動(dòng)作序列，并根據(jù)預(yù)設(shè)的目標(biāo)（如保持平衡、擊中目標(biāo)）進(jìn)行評(píng)估，選擇最優(yōu)的一種來執(zhí)行。

G1在格斗中被擊中或意外滑倒時(shí)，其強(qiáng)大的抗擾動(dòng)能力和快速恢復(fù)能力正是MPC威力的體現(xiàn)。當(dāng)傳感器檢測(cè)到巨大的外部沖擊或身體姿態(tài)異常時(shí)，MPC算法能在毫秒間重新計(jì)算出一條最優(yōu)的恢復(fù)路徑——是后退一步卸力，還是順勢(shì)下蹲，甚至是倒地后如何利用四肢力量完成“鯉魚打挺”。這種“滾動(dòng)優(yōu)化”的在線規(guī)劃方式，讓G1從一個(gè)被動(dòng)執(zhí)行者，變成了一個(gè)能夠主動(dòng)適應(yīng)混亂環(huán)境的“思考者”。現(xiàn)場(chǎng)視頻中“倒了一下子就起來了”的驚嘆，背后正是這種高級(jí)控制算法的支撐。

第二部分：眼觀六路 —— 混亂戰(zhàn)場(chǎng)中的智能感知

一名拳手不僅要站得穩(wěn)，更要看得清、看得懂對(duì)手。在瞬息萬變的格斗擂臺(tái)上，精確感知對(duì)手的位置、姿態(tài)和意圖，是制定有效攻防策略的基礎(chǔ)。單一傳感器無法勝任，宇樹G1依賴的是一套復(fù)雜的多傳感器融合系統(tǒng)。

G1的“五感”：

為了構(gòu)建對(duì)世界的全面認(rèn)知，G1集成了一套先進(jìn)的傳感器系統(tǒng)，協(xié)同工作，互為補(bǔ)充。

傳感器類型

主要功能

G1格斗場(chǎng)景中的應(yīng)用

3D激光雷達(dá) (LiDAR)

精確測(cè)量物體的三維形狀與距離。

在格斗開始前，快速構(gòu)建擂臺(tái)的三維地圖。在對(duì)戰(zhàn)中，高精度地鎖定對(duì)手的實(shí)時(shí)位置和距離，為出拳和踢腿的距離判斷提供關(guān)鍵數(shù)據(jù)。

深度攝像頭

提供彩色圖像和深度信息。

識(shí)別對(duì)手是“機(jī)器人”還是“人類”，并進(jìn)一步分割出其軀干、頭部、手臂等關(guān)鍵部位，為AI判斷有效擊打區(qū)域提供視覺依據(jù)。

慣性測(cè)量單元 (IMU)

高頻測(cè)量機(jī)器人自身的角速度和加速度，感知姿態(tài)。

以數(shù)百赫茲的頻率實(shí)時(shí)反饋G1自身的傾斜、晃動(dòng)和出拳速度，是動(dòng)態(tài)平衡算法最核心的數(shù)據(jù)來源。

力/力矩傳感器

安裝于關(guān)節(jié)，感知與外界的接觸力。

感知每一次出拳擊中對(duì)手時(shí)的反作用力，或被對(duì)手擊中時(shí)的沖擊力大小和方向，為實(shí)時(shí)的平衡調(diào)整和抗擾動(dòng)控制提供直接反饋。

1+1>3 的融合魔法：人機(jī)協(xié)同的決策之眼

在當(dāng)前的格斗比賽中，G1主要由人類通過遙控或體感設(shè)備操控。此時(shí)，傳感器融合扮演了“人機(jī)協(xié)同之眼”的角色：

LiDAR和攝像頭將戰(zhàn)場(chǎng)的三維信息實(shí)時(shí)傳輸給操控者，提供了超越人眼的精準(zhǔn)視角。
當(dāng)操控者下達(dá)“左勾拳”指令時(shí)，G1的AI大腦并非盲目執(zhí)行。它會(huì)結(jié)合IMU感知的自身姿態(tài)和力傳感器感知的地面情況，自主優(yōu)化這個(gè)動(dòng)作，確保在出拳的同時(shí)不會(huì)失去平衡。
被擊中時(shí)，強(qiáng)大的感知系統(tǒng)能瞬間判斷沖擊來源和力度，輔助MPC算法做出最優(yōu)的穩(wěn)定策略。

這解釋了為什么即使背后是人類在操控，機(jī)器人的動(dòng)作依然如此流暢和穩(wěn)定。它不是一個(gè)簡(jiǎn)單的提線木偶，而是一個(gè)擁有強(qiáng)大自主穩(wěn)定和感知能力的“智能機(jī)甲”。

第三部分：力拔千鈞 —— 電驅(qū)“肌肉”的力量革命

G1迅猛的力量和速度，源自其強(qiáng)大的“肌肉”——全電驅(qū)動(dòng)的關(guān)節(jié)。身高1.32米、體重僅35公斤的G1，能夠在小巧的機(jī)身內(nèi)爆發(fā)出驚人的力量，這得益于宇樹科技在核心驅(qū)動(dòng)部件上的深厚積累。

核心部件：高扭矩密度電機(jī)與減速器：宇樹科技自研的高性能伺服電機(jī)，能夠在極小的體積和重量下，輸出巨大的扭矩。例如其用于H1機(jī)器人的M107關(guān)節(jié)電機(jī)，峰值扭矩可達(dá)360牛·米。G1同樣配備了類似的“動(dòng)力心臟”，這使其能夠完成快速的出拳和充滿力量的踢腿動(dòng)作。
全電驅(qū)動(dòng)的優(yōu)勢(shì)：相較于波士頓動(dòng)力舊款A(yù)tlas所采用的液壓驅(qū)動(dòng)，G1的全電驅(qū)動(dòng)方案具有控制精度高、響應(yīng)速度快、能效高、噪音低、易于維護(hù)等顯著優(yōu)勢(shì)。這不僅讓G1的動(dòng)作更加精細(xì)，也極大地降低了其制造成本和維護(hù)難度，為宇樹科技后續(xù)推出售價(jià)僅3.99萬元的R1機(jī)器人、實(shí)現(xiàn)大規(guī)模商業(yè)化鋪平了道路。

波士頓動(dòng)力——這個(gè)曾將液壓驅(qū)動(dòng)玩到極致的王者——最終也全面轉(zhuǎn)向電驅(qū)動(dòng)，這無疑宣告了電驅(qū)動(dòng)的商業(yè)化應(yīng)用時(shí)代已全面到來，而宇樹科技正是這條賽道上的關(guān)鍵玩家。

第四部分：靈魂注入 —— AI如何教會(huì)機(jī)器人格斗

如何讓一個(gè)機(jī)器人學(xué)會(huì)復(fù)雜的格斗動(dòng)作？傳統(tǒng)編程方法早已行不通。宇樹科技采用的是模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)相結(jié)合的先進(jìn)AI訓(xùn)練方法，這正是為G1注入“靈魂”的關(guān)鍵。

第一步：模仿學(xué)習(xí) (Imitation Learning) - 向?qū)＜摇俺鳂I(yè)”

正如宇樹科技創(chuàng)始人王興興所介紹，訓(xùn)練的第一步是“動(dòng)作捕捉”。

“首先動(dòng)作捕捉會(huì)基于一些專業(yè)的格斗運(yùn)動(dòng)員，（根據(jù)）他們的動(dòng)作捕捉數(shù)據(jù)，讓機(jī)器人在虛擬的世界里來學(xué)習(xí)這些動(dòng)作。”

通過讓專業(yè)拳手穿戴傳感器，記錄下他們出拳、踢腿、閃避的精確三維運(yùn)動(dòng)數(shù)據(jù)，AI可以學(xué)習(xí)到一套標(biāo)準(zhǔn)的“格斗動(dòng)作庫(kù)”。這就是G1能夠打出標(biāo)準(zhǔn)刺拳、勾拳的基礎(chǔ)。

第二步：強(qiáng)化學(xué)習(xí) (Reinforcement Learning) - 在虛擬世界中“千錘百煉”

模仿來的動(dòng)作往往是僵硬的，無法適應(yīng)真實(shí)世界的變化。這時(shí)，強(qiáng)化學(xué)習(xí)就派上了用場(chǎng)。

高效的訓(xùn)練場(chǎng)：格斗是一個(gè)絕佳的強(qiáng)化學(xué)習(xí)訓(xùn)練場(chǎng)景。正如媒體分析指出的：“一拳一腳都有清晰的時(shí)間順序和姿態(tài)參數(shù)；防御、閃避、出擊的策略空間可控；成功與否的判斷標(biāo)準(zhǔn)也極為明確，如命中、躲避、倒地等。”
在試錯(cuò)中進(jìn)化：在虛擬仿真環(huán)境中，AI操控G1進(jìn)行數(shù)百萬甚至上億次的模擬對(duì)抗。每一次成功的閃避或擊中都會(huì)獲得“正向獎(jiǎng)勵(lì)”，每一次摔倒或被擊中都會(huì)受到“負(fù)向懲罰”。通過最大化累積獎(jiǎng)勵(lì)，G1的AI“大腦”（一個(gè)深度神經(jīng)網(wǎng)絡(luò)）能夠自主優(yōu)化從專業(yè)拳手那里學(xué)來的動(dòng)作，使其更適應(yīng)自身的機(jī)械結(jié)構(gòu)，動(dòng)作更穩(wěn)健、更高效。

通過“模仿+強(qiáng)化”這兩步，G1不僅學(xué)會(huì)了“怎么打”，更在一定程度上理解了“如何打得更好”。

專題討論：從跑步到格斗，難度躍遷的背后

一個(gè)有趣的現(xiàn)象是，一些在宣傳視頻中能跑酷的機(jī)器人，到了真實(shí)的比賽中（如宇樹H1在人形機(jī)器人運(yùn)動(dòng)會(huì)長(zhǎng)跑比賽中出現(xiàn)的“撞人”事件），仍需要人類遙控。而在格斗賽中，G1也主要由人類操控。這揭示了“自主運(yùn)動(dòng)”與“動(dòng)態(tài)交互”之間巨大的技術(shù)鴻溝。

任務(wù)類型

核心挑戰(zhàn)

技術(shù)側(cè)重

跑步/跑酷

自我平衡與路徑規(guī)劃。核心是處理機(jī)器人自身與一個(gè)相對(duì)靜態(tài)或可預(yù)測(cè)環(huán)境的關(guān)系。

控制算法是關(guān)鍵，強(qiáng)大的MPC足以應(yīng)對(duì)地形變化。感知系統(tǒng)只需快速識(shí)別固定障礙物。

格斗/對(duì)抗

實(shí)時(shí)決策與意圖預(yù)測(cè)。必須處理自身與另一個(gè)動(dòng)態(tài)、不可預(yù)測(cè)、甚至有敵意的智能體的關(guān)系。

感知與決策是核心。不僅要控制自己，還要高速捕捉對(duì)手動(dòng)作、預(yù)測(cè)其意圖，并瞬間做出攻防決策。這對(duì)“大腦”的算力和算法要求呈指數(shù)級(jí)增長(zhǎng)。

結(jié)論：當(dāng)前的機(jī)器人格斗，更多是在測(cè)試和展示機(jī)器人的硬件本體性能（如關(guān)節(jié)速度、力量、抗沖擊性）和基礎(chǔ)控制能力（受控狀態(tài)下的平衡性）。操控者的大腦暫時(shí)替代了機(jī)器人的“戰(zhàn)術(shù)決策大腦”。而自主跑步，則考驗(yàn)的是機(jī)器人的“自主導(dǎo)航與平衡大腦”。

宇樹科技CEO王興興也坦言，為了在比賽中追求極致速度，才采用了遙控策略，并承諾“下次比賽我們肯定是全自主的”。這預(yù)示著，行業(yè)的下一個(gè)目標(biāo)，正是將強(qiáng)大的本體控制與高級(jí)的自主決策AI真正融合。

未來展望：從擂臺(tái)王者到生活助手

宇樹G1在格斗擂臺(tái)上的驚艷表現(xiàn)，絕非僅僅為了博取眼球。這場(chǎng)“熱身賽”背后，是通往更廣闊應(yīng)用場(chǎng)景的堅(jiān)實(shí)一步。

技術(shù)沉淀：在格斗這種極限工況下磨練出的抗沖擊結(jié)構(gòu)、高爆發(fā)力關(guān)節(jié)和強(qiáng)大的平衡算法，將直接應(yīng)用于工業(yè)、救援等高要求場(chǎng)景。一個(gè)能承受重拳的機(jī)器人，在復(fù)雜的工廠或?yàn)?zāi)害現(xiàn)場(chǎng)自然也更加可靠。
成本破局與量產(chǎn)之路：G1的成功展示，連同宇樹科技隨后發(fā)布的售價(jià)僅為3.99萬元的智能伙伴R1，以及“早已啟動(dòng)機(jī)器人量產(chǎn)”的官方表態(tài)，共同宣告了一個(gè)明確的信號(hào)：人形機(jī)器人正加速脫離昂貴的“實(shí)驗(yàn)室玩物”身份，向著可大規(guī)模生產(chǎn)的“智能工具”邁進(jìn)。
終極場(chǎng)景：格斗，只是機(jī)器人上崗前最有看點(diǎn)的一場(chǎng)熱身。真正的拐點(diǎn)，將落在“炒菜、喂貓、養(yǎng)老、送貨、看護(hù)這些瑣碎又高頻的場(chǎng)景里”。當(dāng)G1所展示的靈巧、穩(wěn)定與力量，與更強(qiáng)大的AI大腦結(jié)合，并以親民的價(jià)格進(jìn)入千行百業(yè)乃至千家萬戶時(shí)，一個(gè)由智能機(jī)器人深度參與的社會(huì)新形態(tài)，將不再是遙遠(yuǎn)的科幻。

從宇樹G1的擂臺(tái)首秀，我們看到的不僅是拳腳與機(jī)甲的碰撞，更是控制論、材料學(xué)、人工智能與商業(yè)化雄心共同譜寫的一曲激昂序章。這場(chǎng)革命，才剛剛開始。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.