![]()
引言:當(dāng)格斗賽點(diǎn)燃科技圈
2025年的夏天,在上海世界人工智能大會(huì)(WAIC)的展臺(tái)上,宇樹G1的人形機(jī)器人,身戴拳擊手套,與另一臺(tái)機(jī)器人或真人對(duì)手展開激烈格斗。它時(shí)而迅猛出拳,時(shí)而側(cè)身閃避,動(dòng)作行云流水,即便被擊倒也能在數(shù)秒內(nèi)以一個(gè)漂亮的“鯉魚打挺”迅速起身,恢復(fù)戰(zhàn)斗姿態(tài)。現(xiàn)場(chǎng)觀眾人山人海,驚呼連連,仿佛科幻電影中的“機(jī)甲大戰(zhàn)”真實(shí)上演。
這場(chǎng)面并非孤例。在由中央廣播電視總臺(tái)主辦的《CMG世界機(jī)器人大賽》中,宇樹G1更是作為主角,上演了全球首場(chǎng)以人形機(jī)器人為主體的格斗競(jìng)技賽。這些曾經(jīng)只存在于想象中的場(chǎng)景,如今正以前所未有的速度變?yōu)楝F(xiàn)實(shí)。
然而,當(dāng)炫目的燈光和激烈的對(duì)抗落幕后,一個(gè)更深層次的問題浮出水面:這究竟是一場(chǎng)精心編排的“秀”,還是代表著機(jī)器人技術(shù)的一次本質(zhì)性飛躍?宇樹G1是如何在混亂的格斗中站穩(wěn)腳跟、看清對(duì)手并精準(zhǔn)出擊的?我們來探究從實(shí)驗(yàn)室走向擂臺(tái),再?gòu)睦夼_(tái)走向現(xiàn)實(shí)的必經(jīng)之路。
第一部分:穩(wěn)如磐石 —— 動(dòng)態(tài)平衡的藝術(shù)與科學(xué)
對(duì)于一個(gè)人形機(jī)器人而言,一切高級(jí)功能的實(shí)現(xiàn),都建立在動(dòng)態(tài)平衡這一地基之上。與擁有寬大底座的工業(yè)機(jī)械臂不同,G1僅靠?jī)芍荒_支撐約35公斤的體重,并在運(yùn)動(dòng)中持續(xù)對(duì)抗重力與慣性,這是它能夠行動(dòng)自如的首要前提,也是技術(shù)上最大的挑戰(zhàn)之一。
核心技術(shù)一:零力矩點(diǎn)(Zero Moment Point, ZMP)與全身控制
通俗理解: ZMP可以想象成機(jī)器人所有對(duì)地壓力匯聚而成的一個(gè)“合力點(diǎn)”。只要這個(gè)點(diǎn)始終保持在機(jī)器人雙腳(或單腳)構(gòu)成的支撐區(qū)域內(nèi),機(jī)器人理論上就不會(huì)傾倒。
在格斗中,G1的每一個(gè)動(dòng)作——無論是出拳、踢腿還是閃避——都會(huì)導(dǎo)致其全身質(zhì)心(Center of Mass, CoM)的劇烈變化。其內(nèi)置的智能平衡算法,核心任務(wù)之一就是實(shí)時(shí)計(jì)算并控制ZMP。當(dāng)G1揮出右拳時(shí),算法會(huì)瞬間計(jì)算出如何調(diào)動(dòng)其左腿、腰部乃至左臂的29個(gè)關(guān)節(jié),協(xié)同產(chǎn)生一個(gè)反向的力矩,確保ZMP點(diǎn)穩(wěn)定地保持在雙腳之間。
這種基于模型的全身控制(Whole-Body Control)策略,使得G1的動(dòng)作不再是各個(gè)關(guān)節(jié)的獨(dú)立運(yùn)動(dòng),而是一個(gè)高度協(xié)調(diào)的有機(jī)整體,這是其動(dòng)作看起來“行云流水”而非僵硬機(jī)械的根本原因。
核心技術(shù)二:模型預(yù)測(cè)控制(Model Predictive Control, MPC)與抗擾動(dòng)能力
如果說ZMP是保證“下一步不摔”的戰(zhàn)術(shù),那么MPC就是“深謀遠(yuǎn)慮”的戰(zhàn)略。人類拳手在對(duì)戰(zhàn)時(shí),會(huì)預(yù)判對(duì)手的攻擊并提前做出反應(yīng)。MPC賦予了G1類似的能力。
工作原理: MPC基于G1精確的動(dòng)力學(xué)模型,在每個(gè)控制周期內(nèi),它會(huì)預(yù)測(cè)未來一小段時(shí)間內(nèi)數(shù)千種可能的動(dòng)作序列,并根據(jù)預(yù)設(shè)的目標(biāo)(如保持平衡、擊中目標(biāo))進(jìn)行評(píng)估,選擇最優(yōu)的一種來執(zhí)行。
G1在格斗中被擊中或意外滑倒時(shí),其強(qiáng)大的抗擾動(dòng)能力和快速恢復(fù)能力正是MPC威力的體現(xiàn)。當(dāng)傳感器檢測(cè)到巨大的外部沖擊或身體姿態(tài)異常時(shí),MPC算法能在毫秒間重新計(jì)算出一條最優(yōu)的恢復(fù)路徑——是后退一步卸力,還是順勢(shì)下蹲,甚至是倒地后如何利用四肢力量完成“鯉魚打挺”。這種“滾動(dòng)優(yōu)化”的在線規(guī)劃方式,讓G1從一個(gè)被動(dòng)執(zhí)行者,變成了一個(gè)能夠主動(dòng)適應(yīng)混亂環(huán)境的“思考者”。現(xiàn)場(chǎng)視頻中“倒了一下子就起來了”的驚嘆,背后正是這種高級(jí)控制算法的支撐。
![]()
第二部分:眼觀六路 —— 混亂戰(zhàn)場(chǎng)中的智能感知
一名拳手不僅要站得穩(wěn),更要看得清、看得懂對(duì)手。在瞬息萬變的格斗擂臺(tái)上,精確感知對(duì)手的位置、姿態(tài)和意圖,是制定有效攻防策略的基礎(chǔ)。單一傳感器無法勝任,宇樹G1依賴的是一套復(fù)雜的多傳感器融合系統(tǒng)。
G1的“五感”:
為了構(gòu)建對(duì)世界的全面認(rèn)知,G1集成了一套先進(jìn)的傳感器系統(tǒng),協(xié)同工作,互為補(bǔ)充。
傳感器類型
主要功能
G1格斗場(chǎng)景中的應(yīng)用
3D激光雷達(dá) (LiDAR)
精確測(cè)量物體的三維形狀與距離。
在格斗開始前,快速構(gòu)建擂臺(tái)的三維地圖。在對(duì)戰(zhàn)中,高精度地鎖定對(duì)手的實(shí)時(shí)位置和距離,為出拳和踢腿的距離判斷提供關(guān)鍵數(shù)據(jù)。
深度攝像頭
提供彩色圖像和深度信息。
識(shí)別對(duì)手是“機(jī)器人”還是“人類”,并進(jìn)一步分割出其軀干、頭部、手臂等關(guān)鍵部位,為AI判斷有效擊打區(qū)域提供視覺依據(jù)。
慣性測(cè)量單元 (IMU)
高頻測(cè)量機(jī)器人自身的角速度和加速度,感知姿態(tài)。
以數(shù)百赫茲的頻率實(shí)時(shí)反饋G1自身的傾斜、晃動(dòng)和出拳速度,是動(dòng)態(tài)平衡算法最核心的數(shù)據(jù)來源。
力/力矩傳感器
安裝于關(guān)節(jié),感知與外界的接觸力。
感知每一次出拳擊中對(duì)手時(shí)的反作用力,或被對(duì)手擊中時(shí)的沖擊力大小和方向,為實(shí)時(shí)的平衡調(diào)整和抗擾動(dòng)控制提供直接反饋。
1+1>3 的融合魔法:人機(jī)協(xié)同的決策之眼
在當(dāng)前的格斗比賽中,G1主要由人類通過遙控或體感設(shè)備操控。此時(shí),傳感器融合扮演了“人機(jī)協(xié)同之眼”的角色:
LiDAR和攝像頭將戰(zhàn)場(chǎng)的三維信息實(shí)時(shí)傳輸給操控者,提供了超越人眼的精準(zhǔn)視角。
當(dāng)操控者下達(dá)“左勾拳”指令時(shí),G1的AI大腦并非盲目執(zhí)行。它會(huì)結(jié)合IMU感知的自身姿態(tài)和力傳感器感知的地面情況,自主優(yōu)化這個(gè)動(dòng)作,確保在出拳的同時(shí)不會(huì)失去平衡。
被擊中時(shí),強(qiáng)大的感知系統(tǒng)能瞬間判斷沖擊來源和力度,輔助MPC算法做出最優(yōu)的穩(wěn)定策略。
這解釋了為什么即使背后是人類在操控,機(jī)器人的動(dòng)作依然如此流暢和穩(wěn)定。它不是一個(gè)簡(jiǎn)單的提線木偶,而是一個(gè)擁有強(qiáng)大自主穩(wěn)定和感知能力的“智能機(jī)甲”。
![]()
第三部分:力拔千鈞 —— 電驅(qū)“肌肉”的力量革命
G1迅猛的力量和速度,源自其強(qiáng)大的“肌肉”——全電驅(qū)動(dòng)的關(guān)節(jié)。身高1.32米、體重僅35公斤的G1,能夠在小巧的機(jī)身內(nèi)爆發(fā)出驚人的力量,這得益于宇樹科技在核心驅(qū)動(dòng)部件上的深厚積累。
核心部件:高扭矩密度電機(jī)與減速器:宇樹科技自研的高性能伺服電機(jī),能夠在極小的體積和重量下,輸出巨大的扭矩。例如其用于H1機(jī)器人的M107關(guān)節(jié)電機(jī),峰值扭矩可達(dá)360牛·米。G1同樣配備了類似的“動(dòng)力心臟”,這使其能夠完成快速的出拳和充滿力量的踢腿動(dòng)作。
全電驅(qū)動(dòng)的優(yōu)勢(shì):相較于波士頓動(dòng)力舊款A(yù)tlas所采用的液壓驅(qū)動(dòng),G1的全電驅(qū)動(dòng)方案具有控制精度高、響應(yīng)速度快、能效高、噪音低、易于維護(hù)等顯著優(yōu)勢(shì)。這不僅讓G1的動(dòng)作更加精細(xì),也極大地降低了其制造成本和維護(hù)難度,為宇樹科技后續(xù)推出售價(jià)僅3.99萬元的R1機(jī)器人、實(shí)現(xiàn)大規(guī)模商業(yè)化鋪平了道路。
波士頓動(dòng)力——這個(gè)曾將液壓驅(qū)動(dòng)玩到極致的王者——最終也全面轉(zhuǎn)向電驅(qū)動(dòng),這無疑宣告了電驅(qū)動(dòng)的商業(yè)化應(yīng)用時(shí)代已全面到來,而宇樹科技正是這條賽道上的關(guān)鍵玩家。
![]()
第四部分:靈魂注入 —— AI如何教會(huì)機(jī)器人格斗
如何讓一個(gè)機(jī)器人學(xué)會(huì)復(fù)雜的格斗動(dòng)作?傳統(tǒng)編程方法早已行不通。宇樹科技采用的是模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)相結(jié)合的先進(jìn)AI訓(xùn)練方法,這正是為G1注入“靈魂”的關(guān)鍵。
第一步:模仿學(xué)習(xí) (Imitation Learning) - 向?qū)<摇俺鳂I(yè)”
正如宇樹科技創(chuàng)始人王興興所介紹,訓(xùn)練的第一步是“動(dòng)作捕捉”。
“首先動(dòng)作捕捉會(huì)基于一些專業(yè)的格斗運(yùn)動(dòng)員,(根據(jù))他們的動(dòng)作捕捉數(shù)據(jù),讓機(jī)器人在虛擬的世界里來學(xué)習(xí)這些動(dòng)作。”
通過讓專業(yè)拳手穿戴傳感器,記錄下他們出拳、踢腿、閃避的精確三維運(yùn)動(dòng)數(shù)據(jù),AI可以學(xué)習(xí)到一套標(biāo)準(zhǔn)的“格斗動(dòng)作庫(kù)”。這就是G1能夠打出標(biāo)準(zhǔn)刺拳、勾拳的基礎(chǔ)。
第二步:強(qiáng)化學(xué)習(xí) (Reinforcement Learning) - 在虛擬世界中“千錘百煉”
模仿來的動(dòng)作往往是僵硬的,無法適應(yīng)真實(shí)世界的變化。這時(shí),強(qiáng)化學(xué)習(xí)就派上了用場(chǎng)。
高效的訓(xùn)練場(chǎng):格斗是一個(gè)絕佳的強(qiáng)化學(xué)習(xí)訓(xùn)練場(chǎng)景。正如媒體分析指出的:“一拳一腳都有清晰的時(shí)間順序和姿態(tài)參數(shù);防御、閃避、出擊的策略空間可控;成功與否的判斷標(biāo)準(zhǔn)也極為明確,如命中、躲避、倒地等。”
在試錯(cuò)中進(jìn)化:在虛擬仿真環(huán)境中,AI操控G1進(jìn)行數(shù)百萬甚至上億次的模擬對(duì)抗。每一次成功的閃避或擊中都會(huì)獲得“正向獎(jiǎng)勵(lì)”,每一次摔倒或被擊中都會(huì)受到“負(fù)向懲罰”。通過最大化累積獎(jiǎng)勵(lì),G1的AI“大腦”(一個(gè)深度神經(jīng)網(wǎng)絡(luò))能夠自主優(yōu)化從專業(yè)拳手那里學(xué)來的動(dòng)作,使其更適應(yīng)自身的機(jī)械結(jié)構(gòu),動(dòng)作更穩(wěn)健、更高效。
通過“模仿+強(qiáng)化”這兩步,G1不僅學(xué)會(huì)了“怎么打”,更在一定程度上理解了“如何打得更好”。
![]()
專題討論:從跑步到格斗,難度躍遷的背后
一個(gè)有趣的現(xiàn)象是,一些在宣傳視頻中能跑酷的機(jī)器人,到了真實(shí)的比賽中(如宇樹H1在人形機(jī)器人運(yùn)動(dòng)會(huì)長(zhǎng)跑比賽中出現(xiàn)的“撞人”事件),仍需要人類遙控。而在格斗賽中,G1也主要由人類操控。這揭示了“自主運(yùn)動(dòng)”與“動(dòng)態(tài)交互”之間巨大的技術(shù)鴻溝。
任務(wù)類型
核心挑戰(zhàn)
技術(shù)側(cè)重
跑步/跑酷
自我平衡與路徑規(guī)劃。 核心是處理機(jī)器人自身與一個(gè)相對(duì)靜態(tài)或可預(yù)測(cè)環(huán)境的關(guān)系。
控制算法是關(guān)鍵,強(qiáng)大的MPC足以應(yīng)對(duì)地形變化。感知系統(tǒng)只需快速識(shí)別固定障礙物。
格斗/對(duì)抗
實(shí)時(shí)決策與意圖預(yù)測(cè)。 必須處理自身與另一個(gè)動(dòng)態(tài)、不可預(yù)測(cè)、甚至有敵意的智能體的關(guān)系。
感知與決策是核心。不僅要控制自己,還要高速捕捉對(duì)手動(dòng)作、預(yù)測(cè)其意圖,并瞬間做出攻防決策。這對(duì)“大腦”的算力和算法要求呈指數(shù)級(jí)增長(zhǎng)。
結(jié)論: 當(dāng)前的機(jī)器人格斗,更多是在測(cè)試和展示機(jī)器人的硬件本體性能(如關(guān)節(jié)速度、力量、抗沖擊性)和基礎(chǔ)控制能力(受控狀態(tài)下的平衡性)。操控者的大腦暫時(shí)替代了機(jī)器人的“戰(zhàn)術(shù)決策大腦”。而自主跑步,則考驗(yàn)的是機(jī)器人的“自主導(dǎo)航與平衡大腦”。
宇樹科技CEO王興興也坦言,為了在比賽中追求極致速度,才采用了遙控策略,并承諾“下次比賽我們肯定是全自主的”。這預(yù)示著,行業(yè)的下一個(gè)目標(biāo),正是將強(qiáng)大的本體控制與高級(jí)的自主決策AI真正融合。
未來展望:從擂臺(tái)王者到生活助手
宇樹G1在格斗擂臺(tái)上的驚艷表現(xiàn),絕非僅僅為了博取眼球。這場(chǎng)“熱身賽”背后,是通往更廣闊應(yīng)用場(chǎng)景的堅(jiān)實(shí)一步。
技術(shù)沉淀:在格斗這種極限工況下磨練出的抗沖擊結(jié)構(gòu)、高爆發(fā)力關(guān)節(jié)和強(qiáng)大的平衡算法,將直接應(yīng)用于工業(yè)、救援等高要求場(chǎng)景。一個(gè)能承受重拳的機(jī)器人,在復(fù)雜的工廠或?yàn)?zāi)害現(xiàn)場(chǎng)自然也更加可靠。
成本破局與量產(chǎn)之路:G1的成功展示,連同宇樹科技隨后發(fā)布的售價(jià)僅為3.99萬元的智能伙伴R1,以及“早已啟動(dòng)機(jī)器人量產(chǎn)”的官方表態(tài),共同宣告了一個(gè)明確的信號(hào):人形機(jī)器人正加速脫離昂貴的“實(shí)驗(yàn)室玩物”身份,向著可大規(guī)模生產(chǎn)的“智能工具”邁進(jìn)。
終極場(chǎng)景:格斗,只是機(jī)器人上崗前最有看點(diǎn)的一場(chǎng)熱身。真正的拐點(diǎn),將落在“炒菜、喂貓、養(yǎng)老、送貨、看護(hù)這些瑣碎又高頻的場(chǎng)景里”。當(dāng)G1所展示的靈巧、穩(wěn)定與力量,與更強(qiáng)大的AI大腦結(jié)合,并以親民的價(jià)格進(jìn)入千行百業(yè)乃至千家萬戶時(shí),一個(gè)由智能機(jī)器人深度參與的社會(huì)新形態(tài),將不再是遙遠(yuǎn)的科幻。
從宇樹G1的擂臺(tái)首秀,我們看到的不僅是拳腳與機(jī)甲的碰撞,更是控制論、材料學(xué)、人工智能與商業(yè)化雄心共同譜寫的一曲激昂序章。這場(chǎng)革命,才剛剛開始。
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.