Jay 發自 凹非寺
量子位 | 公眾號 QbitAI
嚯!先是OpenClaw玩轉互聯網,這下春晚也被機器人占領了。
打開電視,到處都是機器人,簡直成了一場硅基生物狂歡節。
宇樹、魔法原子、銀河通用……各家機器人輪番上陣,引得家里客廳驚呼連連。
確實很難想象,明明去年還在扭秧歌,今年居然已經發展成了這樣子。
但要說印象最深刻的,還得是松延動力的這個小品節目,《奶奶的最愛》。
![]()
當時這四位一立正,我一看,就尋思最右邊這小家伙不簡單。
不僅衣服是本命紅,還戴個紅色小棉帽,估計是最受偏愛的「大孫子」。
![]()
也確實不怪節目組偏心,這個小奶音,配上拽拽的走路姿勢,實在太萌了。

但可別被它的外表輕易蒙蔽,最受奶奶偏愛的「孫子」,說話可是相當不饒人。
- 你確實是個笑話!
![]()
對了,亦莊機器人馬拉松上的「小孩哥」也在,這次還是雙胞胎。
講著講著,咵一下給觀眾來了個后空翻。

下面更是重磅,千算萬算沒算到,會有個和蔡明老師長得一模一樣的機器人出現……
![]()
很難想象,這要是去年的我,看到2026年春節的自己窩在沙發上——
嗑瓜子的手停滯在半空中,目瞪口呆地看著這一個比一個離譜的機器人,會是什么想法……
春晚幕后大揭秘
線上終究隔了層屏幕,為了檢驗這些機器人在節目下的真實表現,量子位特意近距離給大家伙瞅了瞅。
看,這就是春晚開場登臺的,蔡明老師的寶貝大孫子組合!
臺上表現很chill,其實訓練相當刻苦,天天擱這猛猛排練節目。
![]()
令人印象深刻的是,相比節目上,「小孩哥」在線下的沖擊力明顯強很多。
小身體大能量,而且有聲音的加成,機器元件在空翻時碰撞的聽感非常清脆。
聽松延動力的工作人員說,「小孩哥」每天的日常就是隨地大小翻,室內翻完馬路翻,馬路翻完草坪翻。
為了給觀眾表演一次成功的空翻,「小孩哥」承受了太多它這個年齡不該承受的東西…

接下來,要給大家著重介紹,這次春晚松延動力大家族中,我個人最喜歡的機器人——小布米。
對,就是節目上一身本命紅,腦袋上系個大棉帽的「小奶娃」。
這是全球首款萬元級機器人,售價9998元起
特別迷你,身高不到一米,跟剛學會走路的小朋友差不多。
配合上這勁爆的舞姿,實在太萌了。

最讓我驚喜的,是它的語音交互。
當時工作人員讓它講了個冷笑話。
要不是現場人太多,我真有點要蚌埠住了。關鍵誰受得了它這樣「一本正經」地調侃企鵝啊。
![]()
問了下才知道,奶聲奶氣的小布米背后,原來是AI界的「小品女王」——豆包
沒錯,它倆底層都是豆包大模型
雖然個頭小小,但智商真不容小覷。
我們在現場考了它那個困擾無數頂尖AI的「洗車悖論」:
- 家離洗車店800米,我應該開車還是走路去?
本來沒抱啥希望,結果——它居然答對了!?
平時沒少和AI語音聊天,但親眼看到這么小一個機器人,用奶聲奶氣的萌娃音跟你說話,真的很不一樣。
EQ也很高。
當聽到有人說「和朋友吵架了」,小布米沒有一上來就講大道理,而是先共情:「一定很難受吧。」
還拿「牙齒和舌頭」打比方,說好朋友鬧別扭很正常,建議等氣消了好好聊聊。
大過年的,咱就不要搞硬核技術測試了。
量子位托小布米祝大家馬年快樂,「快樂馬不停,每天都馬力全開」!
不錯不錯,咱也算是第一波收到硅基生物定制拜年的人類了。
松延動力x火山引擎,大腦與身體的強強聯手
2025年底,松延動力發布了首款萬元級人形機器人小布米Bumi,面向ToC啟動了量產。
但光有硬件還不夠。要想真正交付給消費者,小布米必須能自然地和人交互。
畢竟,目前家庭場景里,機器人的核心角色還是「陪伴」。如果不能說話、聽不懂指令,體驗會大打折扣。
語音是消費級機器人的關鍵入口。不管是陪聊、跳舞,還是日常互動,幾乎都得靠對話來觸發。
這也正是火山引擎和松延動力達成合作的重要契機。
沒想到的是,在正式交付前,春晚成了第一個實戰考場。
松延動力的節目比較特殊,它不是純表演型,而是語言類,高度依賴實時對話和角色互動。
而在真人陪聊、角色扮演這一塊,豆包應該是當之無愧的「女王」了。
于是雙方一拍即合,把這套方案搬上了春晚舞臺。
具體來說,火山引擎為「演員們」定制了一套端到端的豆包語音交互全家桶,核心是三個環節:ASR(語音識別)、LLM(大語言模型)、TTS(語音合成)。
先看ASR。
這個環節直接影響模型智商的下限。識別出了問題,LLM再聰明,回復也是牛頭不對馬嘴。
火山引擎為松延動力配的豆包語音識別模型2.0,是一雙會「思考」的耳朵。
打個比方,一般來說,當你提到蘇轍被貶的「筠州」,普通模型很容易聽成其他同義詞,比如「云州」或「鄆州」。
人類通常不會犯這種錯誤,只要有一定的上下文,我們就能反應過來——
「噢,現在在聊蘇轍,那應該是筠州。」
豆包的語音識別便參考了這種真人交互習慣。
接下來便交由LLM組織語言,采用的是豆包大模型
這點就不多做贅述了,大家日常都體驗過。
一旦LLM開始輸出第一個Token,TTS便開始同步生成語音,邊生成邊播放。
當然,讓人感受最直觀的,肯定還是聽到聲音出來的那一瞬間。
這次春晚用的是豆包語音合成模型2.0
相比傳統模型,豆包在文本的情緒演繹上下了更多功夫,比如語氣、語調、停頓等。
這層額外的情緒信息,是豆包的「人味秘方」。
不僅音色還原度高,更能根據當前對話內容,選擇最合適的「聲音表演」方式。
![]()
可能有人會說:這套「聽見-思考-說話」的閉環,火山引擎上不是早就有現成方案了嗎?
理論上沒錯,但要達到春晚級別的效果,不是調個API就能搞定的。
最直觀的差異來自輸入端硬件。
機器人的攝像頭分辨率不如手機,麥克風陣列布局、收音結構也不同。這些都得重新適配和優化。
更大的挑戰是使用場景
平時你用手機和AI聊天,嘴離麥克風就十幾厘米;但在家庭場景里,人和機器人往往隔著一到兩米,甚至更遠。
而春晚舞臺?更是地獄級難度:演員站位不固定、環境噪音嘈雜、網絡信號波動……
并且幾乎零容錯,全國觀眾盯著的。
為了保證節目效果,火山引擎直接開啟「爆肝模式」,專門打造了一套春晚定制版實時音視頻方案,負責語音數據的采集、處理和低延遲傳輸。
在此基礎上,還疊加了多項黑科技:3A降噪、VAD打斷、聲紋識別……
可以說,為了讓機器人在臺上博觀眾一笑,火山引擎在背后都快轉冒煙了。
最終效果大家也看到了。整體時延控制在1秒以內,已經接近人與人對話的自然狀態。
![]()
不過,費這么大功夫,如果只是為了和機器人聊天,有點殺雞用牛刀。
具身形態的真正價值,在于它可以把語言和肢體動作結合起來。
舉個例子。
當一個小朋友放學回家,郁悶地站在門口嘆氣:
「我今天考試考砸了。」
如果只是個智能音箱,或許只能說——
「沒關系,我們一起看看哪里可以改進」。
但如果是小布米,它可以慢慢走到孩子身邊,伸出「圓手」,輕輕拍拍他的肩膀。
這一刻,肢體接觸傳遞的溫度,是再多文本Token也換不來的。
具身智能正在走向消費級
自去年夏天的WAIC以來,關于人形機器人是不是泡沫的爭論,幾乎沒停過。
但另一方面,這恰恰也說明,機器人在公眾視野里的出現頻率越來越高,迭代速度越來越快,已經到了無法被忽視的程度。
去年春晚,人形機器人還只是在臺上轉個手絹;
今年呢?遍地開花,連小品都安排上了。
盡管如此,開懷大笑之后,仍然無法避免那個靈魂之問:
我們真的需要講小品的機器人嗎?
![]()
對此,松延動力創始人姜哲源的回答是:
技術存在的意義,從來都不只有幫人類干活。
在他看來,對于所有產品,價值都可以分為兩種,實用價值和情緒價值。
很多消費品都不能干活,它們存在的意義,就是讓人開心。
機器人也一樣。
能端茶倒水當然最好,但如果它能陪伴老人、安慰小孩、甚至讓你笑出聲,那也是一種真實的價值。
更何況,對消費級市場而言,機器人也并不是只能提供情緒價值。
K12教育,便是松延動力正在重點探索的下一個落地方向。
以編程為例,有一個硬件載體,孩子能更直觀看到代碼-動作的映射,會如何影響現實世界。
這種即時、具象的反饋,是屏幕給不了的。
而人形,本身就是人類科技最前沿、也最浪漫的想象。
小布米支持圖形化編程,通過拖拽式編程軟件,孩子可以給機器人設定這樣一個任務:
- 在父母結婚紀念日時,從房間里走出來,比一個心。
姜哲源表示,有一個機器人在家里,對拓寬孩子的視野有很大幫助。
- 如果孩子從小就接觸人形機器人,他對這些領域的感知,會比同齡人早好幾年。
事實也印證了松延動力的思考。
從一線反饋看,無論是家長還是學校,對教育機器人都有非常強烈的需求。而這些需求,都是現有技術已經能滿足的。
過去,人形機器人的落地場景,主要還是兩類:商演和科研
但這兩條路,都算不上「長坡厚雪」。
商演天然有邊際效應遞減。
第一次看很驚艷;第二次,還不錯;但第三次,就不禁想問「它啥時候能去工廠擰螺絲?」
相對而言,科研要堅固一些。但場景集中在高校,天花板很大程度上取決于學校預算。
而且,科研存在周期性波動,一旦熱度下降,需求回落得也會很快。
教育,可能是破局的關鍵。
首先,這是一場確定性極高的大趨勢:隨著AI滲透進基礎教育,人形機器人作為「具身教具」,角色只會越來越重。
一開始可能集中在超級城市,但很快會向其他地區滲透。最終,這會是一個規模巨大的市場。
更重要的,是滲透深度。
機器人+教育,不是把一臺機器人塞進教室這么簡單,必須配套完整的體系:
教師培訓、課程設計、教學場景適配、評估標準……
一旦這套解決方案跑通,形成成熟的解決方案,機器人會成為教學基礎設施的一部分,提供長期穩定存在的結構性需求。
雖然暫時還不能在家當保姆,但這個中間態,可以在創造價值的同時,為具身智能的發展,爭取更多時間,
![]()
跳舞、演小品,只是起點。
未來,硅基智能在生活中的比例只會越來越高。
也許五年后的除夕夜——
真會有一臺機器人,翹著二郎腿坐在你家沙發上,一邊幫你剝瓜子,一邊吐槽春晚節目。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.