網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

我們采訪了春晚秀武術(shù)的宇樹機器人，發(fā)現(xiàn)它還挺有人味兒的。。。

2026-02-17 00:07:14　來源: 差評XPIN

浙江舉報

分享至

跑酷、跳馬、后空翻、雙截棍、醉拳。。。如果只看這幾個關(guān)鍵詞，你八成以為這是哪家武術(shù)學(xué)校的招生簡章。

但這回，差評君說的是春晚節(jié)目《武 BOT 》。

幾十個機器人依次排開，動作連貫、節(jié)奏緊湊，上臺就是一套零幀起手的絲滑連招。

彈幕一開，驚起 6 聲一片。

微博這邊更是直接炸鍋，評論區(qū)蓋了幾百層樓，大伙兒紛紛表示：震驚，再看億遍。

連見多識廣的編輯部，都忍不住倒吸一口涼氣。

說實話，對比去年的原地站樁，今年春晚的宇樹機器人連翻帶打、招招到位，不說和人一模一樣，這簡直是在超越人類的邊緣反復(fù)試探。。。

那么問題來了，機器人到底是怎么做出這么炫酷的動作的？機器人，是怎么做到這么有人味兒的？

這回，差評君提前潛入春晚排練間，采訪到了這次登臺的宇樹 G1 機器人 —— 笨笨，聽它給各位差友講講幕后的故事。

剛溜進屋，差評君一眼鎖定全場目光的焦點。笨笨上來就是狠活兒，原地空翻 high 到不行。

緊跟著又是一段關(guān)節(jié)絲滑，身體搖擺起伏控制恰到好處的螳螂拳：

最后一套武術(shù)連招收尾，鐵甲鋼拳一身蠻力，這壓迫感各位差友感受一下：

但走下舞臺的笨笨，也只是普通 “ 人 ” 罷了。

要在鏡頭聚焦下做到萬無一失，背后還有更多無人知曉的艱辛。

在排練間脫下外套，它的身上滿是練習(xí)留下的傷痕。好在越努力越幸運，這句話對硅基打工人同樣適用。

想必大伙兒看得出，今年春晚的表演難度極高。如果說去年機器人還只會站樁模仿人類，今年的機器人，已經(jīng)在超越人類的路上了。

即使動作從去年的站樁輸出，變成了今年的高難特技，宇樹科技 CMO 王其鑫在采訪中表示，笨笨和兄弟們在春晚大規(guī)模彩排里，次次成功零翻車。

而在完美演出的背后，是一整套技術(shù)預(yù)案在瘋狂兜底。

小到不起眼的舞鞋，都是實打?qū)嵉墓こ萄b備。為了不把春晚的玻璃舞臺踩出心理陰影，這雙鞋既要能吸收沖擊，又要保證落地穩(wěn)定，膠水材料都要精挑細選。

大到機器人的控制算法，也做了一波大優(yōu)化。

以前大家總覺得機器人不太聰明，但實際上，今年春晚臺上每個動作的成功，都是它們自己聽音樂、看舞臺、理解環(huán)境，最后實時馴服四肢的結(jié)果。

也就是說，腿要抬多高，下一步隊形往哪走，都要機器人自己來觀察調(diào)整。而這種感知、決策、行動的閉環(huán)，一直是具身智能的長期難點之一。

說實話，剛開始差評君也以為這就是全部了。直到我們把機器人演員笨笨抓來嘮兩句，才發(fā)現(xiàn)春晚臺前這些 “ 武將 ” 背后居然還有沒見過的文戲，而且開口就是高情商。。。

這背后，是宇樹和火山引擎一起調(diào)教的語音對話能力，在智力、眼力和嘴皮子上都下了不少功夫。

比如我們問起它和成龍誰更厲害，笨笨立刻謙虛起來了：

這回答和笑聲一搭配，求生欲拉滿：

不知道各位差友是啥感覺，反正差評君覺得，會說話的笨笨不再像個冰冷的跳舞機，多少帶點感情。

我們能明顯感覺出，笨笨不止聲線和真人差不多，對不同的內(nèi)容，它的情緒表達是不一樣的。好事語調(diào)高，語速快；壞事語調(diào)低，心情低落。

深入問了火山引擎的技術(shù)團隊，笨笨說話的背后，全靠豆包語音合成模型在發(fā)力。

機器人每一句輸出前，模型都要先理解上下文的語義和情緒，再決定表達方式。語速是急是緩，語調(diào)是高是低，甚至停頓的位置、情感參數(shù)都在動態(tài)生成。這也是為什么它聽起來沒有棒讀感，更像人一樣在說話。

聲線也不是隨便生成，而是專門按宇樹 G1 的氣質(zhì)捏出來的，主打一個青春男大。

不過，光有感情還不夠，真正讓笨笨開竅的，是豆包大語言模型。

不只語音識別精準，你讓它整段春節(jié)祝詞，十秒鐘不到，吉祥話直接批發(fā)式輸出：

代表機器人群體的發(fā)言也是滴水不漏：

笨笨還向差評君透露，豆包大模型的視覺理解能力，甚至能讓機器人看懂世界。

之前邪惡豆包的穿搭指導(dǎo)不知道各位差友刷到?jīng)]，藍高跟配紅絲襪，直男推薦荷葉邊，短裙當披肩。。。開了眼的豆包沒干啥好事，純純報復(fù)人類。

好在笨笨挺老實，讓它評價一下過年走親戚的穿搭，不是瞎夸，它真能看懂你身上穿了啥，再把情緒價值直接給足：

但大家對機器人和大模型的結(jié)合，顯然不止這些期待。差評君采訪了火山引擎的幕后團隊，“ 一方面是想讓機器人更有情緒，能聊天陪伴；但更重要的，是驗證一套更通用的能力 —— 讓機器聽懂人話，再把理解變成行動。”

當然，這話有點兒玄。差評君當場發(fā)問：現(xiàn)在看起來，不就是用嘴下個命令嘛？

這下技術(shù)人員坐不住了，這事兒要做好，可比外行人看起來的復(fù)雜多了。

人輕飄飄一句 “ 你往前走一點 ”，可 “ 前 ” 是相對誰的方向？“ 一點 ”是幾厘米？這就是語音識別 + 大模型語義推理的第一關(guān)，把模糊的人話變成精確意圖。

接下來，模型還得負責(zé)把指令翻譯給機器人聽，拆成細致的動作安排。腿先抬多少、身體往哪偏、腳什么時候落地，全都得精確計算。同時規(guī)劃幾十個關(guān)節(jié)，復(fù)雜的協(xié)同控制，是大模型的第二關(guān)。

雖然現(xiàn)在語音控制機器人能做的事還不是很多，也許只能給你一個擁抱。

但這只是機器人聽懂人話的第一步。說不定有一天，只要一聲令下，承包家務(wù)、輔導(dǎo)作業(yè)、外出打工補貼家用都成機器人的標配，就跟現(xiàn)在打開手機讓豆包監(jiān)督小孩寫作業(yè)、教穿搭一樣輕松。

只不過，那時候的小孩哥搞不好已經(jīng)學(xué)會反向攻略機器人，讓硅基生命心甘情愿淪為作業(yè)代寫了。。。

宇樹科技 CMO 王其鑫在采訪中也提到，這次和火山引擎的合作，提升了機器人交互的親切感和生動性，本質(zhì)上，是在補齊機器人和人溝通的那塊短板。

但機器人真正的變化，其實不止停留在 “ 說話更像人 ”。從外到內(nèi)，機器人正在開始像人一樣學(xué)習(xí)。

通過強化學(xué)習(xí)和動作模仿，它們可以把人類的視頻和行為拆解、吸收，再轉(zhuǎn)化成自己的動作邏輯。換句話說，它不再只是按劇本執(zhí)行預(yù)設(shè)程序，而是在理解環(huán)境、適應(yīng)變化的過程中，自己長本事。這一步，是未來機器人進入現(xiàn)實復(fù)雜場景的技術(shù)基礎(chǔ)。

短期內(nèi)，機器人會優(yōu)先進入商用與展示類場景；3 到 5 年，將在工業(yè)與高危環(huán)境大規(guī)模替代人工；而當可靠性與交互能力進一步成熟后，5 到 10 年內(nèi)，人形機器人可能有機會真正走進家庭。

換句話說，我們今天在春晚看到的，正是它們能力驗證的第一步。而未來機器人的目標，是逐步成為人類生產(chǎn)生活的長期搭檔。

回看 2025 年，AI 和具身智能已經(jīng)成了全民話題。即使你沒有刻意關(guān)注，不可否認的是，我們每個人都在被科技的浪潮席卷向前。

而這一次，舞臺同款能走能聊的宇樹機器人，也通過春晚豆包 APP 抽獎互動送出了 25 臺，就像一封投遞向我們的未來請柬。

很多人擔(dān)憂在飛速發(fā)展的時代里迷失，但差評君相信，科技發(fā)展的終點，是人類更美好的生活。

過去，也許你經(jīng)歷過不少煩惱與困惑。那些無人傾訴的深夜，我們選擇把問題交給了 AI。

而在未來，可能就像 Seedance 2.0 制作的春節(jié)宣傳片一樣，當我們拖著一年的疲憊推開家門，機器人早就把房間收拾妥當，做好飯菜。那些在瑣事中消失的時間，終于可以還給身邊更重要的人。

祝各位差友新春快樂。新的一年，希望技術(shù)繼續(xù)進步，也希望它帶來的，是實實在在的輕松。

愿未來的智能更貼近生活，你的日子也因此多一點從容。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.