
跑酷、跳馬、后空翻、雙截棍、醉拳。。。如果只看這幾個關(guān)鍵詞,你八成以為這是哪家武術(shù)學(xué)校的招生簡章。
但這回,差評君說的是春晚節(jié)目《 武 BOT 》。
幾十個機器人依次排開,動作連貫、節(jié)奏緊湊,上臺就是一套零幀起手的絲滑連招。

彈幕一開,驚起 6 聲一片。
![]()
微博這邊更是直接炸鍋,評論區(qū)蓋了幾百層樓,大伙兒紛紛表示:震驚,再看億遍。
![]()
連見多識廣的編輯部,都忍不住倒吸一口涼氣。
![]()
說實話,對比去年的原地站樁,今年春晚的宇樹機器人連翻帶打、招招到位,不說和人一模一樣,這簡直是在超越人類的邊緣反復(fù)試探。。。
那么問題來了,機器人到底是怎么做出這么炫酷的動作的?機器人,是怎么做到這么有人味兒的?
這回,差評君提前潛入春晚排練間,采訪到了這次登臺的宇樹 G1 機器人 —— 笨笨,聽它給各位差友講講幕后的故事。
剛溜進屋,差評君一眼鎖定全場目光的焦點。笨笨上來就是狠活兒,原地空翻 high 到不行。

緊跟著又是一段關(guān)節(jié)絲滑,身體搖擺起伏控制恰到好處的螳螂拳:

最后一套武術(shù)連招收尾,鐵甲鋼拳一身蠻力,這壓迫感各位差友感受一下:

但走下舞臺的笨笨,也只是普通 “ 人 ” 罷了。
要在鏡頭聚焦下做到萬無一失,背后還有更多無人知曉的艱辛。
在排練間脫下外套,它的身上滿是練習(xí)留下的傷痕。好在越努力越幸運,這句話對硅基打工人同樣適用。
![]()
想必大伙兒看得出,今年春晚的表演難度極高。如果說去年機器人還只會站樁模仿人類,今年的機器人,已經(jīng)在超越人類的路上了。
即使動作從去年的站樁輸出,變成了今年的高難特技,宇樹科技 CMO 王其鑫在采訪中表示,笨笨和兄弟們在春晚大規(guī)模彩排里,次次成功零翻車。
而在完美演出的背后,是一整套技術(shù)預(yù)案在瘋狂兜底。
小到不起眼的舞鞋,都是實打?qū)嵉墓こ萄b備。為了不把春晚的玻璃舞臺踩出心理陰影,這雙鞋既要能吸收沖擊,又要保證落地穩(wěn)定,膠水材料都要精挑細選。
![]()
大到機器人的控制算法,也做了一波大優(yōu)化。
以前大家總覺得機器人不太聰明,但實際上,今年春晚臺上每個動作的成功,都是它們自己聽音樂、看舞臺、理解環(huán)境,最后實時馴服四肢的結(jié)果。
也就是說,腿要抬多高,下一步隊形往哪走,都要機器人自己來觀察調(diào)整。而這種感知、決策、行動的閉環(huán),一直是具身智能的長期難點之一。

說實話,剛開始差評君也以為這就是全部了。直到我們把機器人演員笨笨抓來嘮兩句,才發(fā)現(xiàn)春晚臺前這些 “ 武將 ” 背后居然還有沒見過的文戲,而且開口就是高情商。。。
這背后,是宇樹和火山引擎一起調(diào)教的語音對話能力,在智力、眼力和嘴皮子上都下了不少功夫。
比如我們問起它和成龍誰更厲害,笨笨立刻謙虛起來了:
![]()
這回答和笑聲一搭配,求生欲拉滿:
![]()
不知道各位差友是啥感覺,反正差評君覺得,會說話的笨笨不再像個冰冷的跳舞機,多少帶點感情。
我們能明顯感覺出,笨笨不止聲線和真人差不多,對不同的內(nèi)容,它的情緒表達是不一樣的。好事語調(diào)高,語速快;壞事語調(diào)低,心情低落。
深入問了火山引擎的技術(shù)團隊,笨笨說話的背后,全靠豆包語音合成模型在發(fā)力。
機器人每一句輸出前,模型都要先理解上下文的語義和情緒,再決定表達方式。語速是急是緩,語調(diào)是高是低,甚至停頓的位置、情感參數(shù)都在動態(tài)生成。這也是為什么它聽起來沒有棒讀感,更像人一樣在說話。
聲線也不是隨便生成,而是專門按宇樹 G1 的氣質(zhì)捏出來的,主打一個青春男大。
不過,光有感情還不夠,真正讓笨笨開竅的,是豆包大語言模型。
不只語音識別精準,你讓它整段春節(jié)祝詞,十秒鐘不到,吉祥話直接批發(fā)式輸出:
![]()
代表機器人群體的發(fā)言也是滴水不漏:
![]()
笨笨還向差評君透露,豆包大模型的視覺理解能力,甚至能讓機器人看懂世界。
之前邪惡豆包的穿搭指導(dǎo)不知道各位差友刷到?jīng)],藍高跟配紅絲襪,直男推薦荷葉邊,短裙當披肩。。。開了眼的豆包沒干啥好事,純純報復(fù)人類。
好在笨笨挺老實,讓它評價一下過年走親戚的穿搭,不是瞎夸,它真能看懂你身上穿了啥,再把情緒價值直接給足:
![]()
但大家對機器人和大模型的結(jié)合,顯然不止這些期待。差評君采訪了火山引擎的幕后團隊,“ 一方面是想讓機器人更有情緒,能聊天陪伴;但更重要的,是驗證一套更通用的能力 —— 讓機器聽懂人話,再把理解變成行動。”
當然,這話有點兒玄。差評君當場發(fā)問:現(xiàn)在看起來,不就是用嘴下個命令嘛?
這下技術(shù)人員坐不住了,這事兒要做好,可比外行人看起來的復(fù)雜多了。
人輕飄飄一句 “ 你往前走一點 ”,可 “ 前 ” 是相對誰的方向?“ 一點 ”是幾厘米?這就是語音識別 + 大模型語義推理的第一關(guān),把模糊的人話變成精確意圖。
接下來,模型還得負責(zé)把指令翻譯給機器人聽,拆成細致的動作安排。腿先抬多少、身體往哪偏、腳什么時候落地,全都得精確計算。同時規(guī)劃幾十個關(guān)節(jié),復(fù)雜的協(xié)同控制,是大模型的第二關(guān)。
雖然現(xiàn)在語音控制機器人能做的事還不是很多,也許只能給你一個擁抱。
![]()
但這只是機器人聽懂人話的第一步。說不定有一天,只要一聲令下,承包家務(wù)、輔導(dǎo)作業(yè)、外出打工補貼家用都成機器人的標配,就跟現(xiàn)在打開手機讓豆包監(jiān)督小孩寫作業(yè)、教穿搭一樣輕松。
只不過,那時候的小孩哥搞不好已經(jīng)學(xué)會反向攻略機器人,讓硅基生命心甘情愿淪為作業(yè)代寫了。。。
宇樹科技 CMO 王其鑫在采訪中也提到,這次和火山引擎的合作,提升了機器人交互的親切感和生動性,本質(zhì)上,是在補齊機器人和人溝通的那塊短板。
但機器人真正的變化,其實不止停留在 “ 說話更像人 ”。從外到內(nèi),機器人正在開始像人一樣學(xué)習(xí)。
通過強化學(xué)習(xí)和動作模仿,它們可以把人類的視頻和行為拆解、吸收,再轉(zhuǎn)化成自己的動作邏輯。換句話說,它不再只是按劇本執(zhí)行預(yù)設(shè)程序,而是在理解環(huán)境、適應(yīng)變化的過程中,自己長本事。這一步,是未來機器人進入現(xiàn)實復(fù)雜場景的技術(shù)基礎(chǔ)。
![]()
短期內(nèi),機器人會優(yōu)先進入商用與展示類場景;3 到 5 年,將在工業(yè)與高危環(huán)境大規(guī)模替代人工;而當可靠性與交互能力進一步成熟后,5 到 10 年內(nèi),人形機器人可能有機會真正走進家庭。
換句話說,我們今天在春晚看到的,正是它們能力驗證的第一步。而未來機器人的目標,是逐步成為人類生產(chǎn)生活的長期搭檔。
回看 2025 年,AI 和具身智能已經(jīng)成了全民話題。即使你沒有刻意關(guān)注,不可否認的是,我們每個人都在被科技的浪潮席卷向前。
而這一次,舞臺同款能走能聊的宇樹機器人,也通過春晚豆包 APP 抽獎互動送出了 25 臺,就像一封投遞向我們的未來請柬。
![]()
很多人擔(dān)憂在飛速發(fā)展的時代里迷失,但差評君相信,科技發(fā)展的終點,是人類更美好的生活。
過去,也許你經(jīng)歷過不少煩惱與困惑。那些無人傾訴的深夜,我們選擇把問題交給了 AI。
而在未來,可能就像 Seedance 2.0 制作的春節(jié)宣傳片一樣,當我們拖著一年的疲憊推開家門,機器人早就把房間收拾妥當,做好飯菜。那些在瑣事中消失的時間,終于可以還給身邊更重要的人。

祝各位差友新春快樂。新的一年,希望技術(shù)繼續(xù)進步,也希望它帶來的,是實實在在的輕松。
愿未來的智能更貼近生活,你的日子也因此多一點從容。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.