henry 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
2026年的春晚,注定是屬于機(jī)器人的。
不知道有多少人像我一樣,在看到馬麗的“鐵哥們”時(shí),沒繃住,直接笑出了聲。
這個(gè)叫“小蓋”的家伙,是真的物理意義上的“鐵哥們”。
節(jié)目里,騰哥上春晚得靠它,它甚至還給自己排了一出表演干活的“劇本”:

盤盤核桃、疊疊衣服、嗆嗆騰哥,直接把春晚的笑點(diǎn)拉滿了。
但笑過之后,很難忽視的一點(diǎn)是——小蓋這次在春晚做的事情不太一樣。
它不是在秀動(dòng)作,而是在執(zhí)行任務(wù):
貨架取物、清理碎片、整理環(huán)境,甚至串烤腸、疊衣服。

據(jù)悉,這是春晚舞臺(tái)上第一個(gè)上臺(tái)認(rèn)真執(zhí)行任務(wù)、在自己工位上“干活”的機(jī)器人。
而把“小蓋”帶上春晚舞臺(tái)干活的,正是被官方定位為具身大模型機(jī)器人的銀河通用機(jī)器人,以及它背后那套首次公開的“大腦-小腦-神經(jīng)控制”一體化系統(tǒng)銀河星腦AstraBrain。
也正是這套系統(tǒng),讓舞臺(tái)上那些看似隨意的取物、清理、整理,不再依賴動(dòng)作腳本,而是來自完整的感知-決策-執(zhí)行閉環(huán)。
而在節(jié)目外,小蓋也已經(jīng)將這套能力延伸到了全國各地的100家銀河太空艙,真正讓機(jī)器人走進(jìn)生活。
春晚大舞臺(tái),“干活”銀河來
咱不演“馬麗單飛,沈騰怎么辦”的戲中戲,直接看這次真正的主角——
馬麗的“鐵哥們”,小蓋(Galbot)。
“盤核桃”:手內(nèi)靈巧操作+雙手分工協(xié)同
先看一個(gè)看似整活、實(shí)則硬核的動(dòng)作:盤核桃。
關(guān)注機(jī)器人領(lǐng)域的都知道,這事并不簡單。
一方面,核桃表面不規(guī)則、質(zhì)量分布不均,在翻轉(zhuǎn)過程中受力點(diǎn)持續(xù)變化。手指只要有一點(diǎn)點(diǎn)力矩誤差,核桃就會(huì)“cei”在地上。
另一方面,對(duì)機(jī)器人來說,這幾乎等同于人戴著一副鐵手套在盤:觸覺遲鈍、反饋滯后,很難實(shí)時(shí)感知核桃的微小運(yùn)動(dòng)狀態(tài)。
而小蓋之所以在春晚舞臺(tái)上能完成這一動(dòng)作,關(guān)鍵在兩點(diǎn):一雙足夠靈活的機(jī)械手;更重要的是,還要有一個(gè)能做手指關(guān)節(jié)級(jí)微調(diào)控制的“大腦”。
在業(yè)內(nèi),這類能力有個(gè)專業(yè)名字:手內(nèi)操作(In-hand Manipulation)。
它是機(jī)器人靈巧操作里的“皇冠上的明珠”,直接決定機(jī)器人能不能承擔(dān)工業(yè)級(jí)精細(xì)任務(wù),例如擰螺絲、釘釘子這類操作。
對(duì)此,銀河通用的思路,可以用一句話概括:虛擬世界練招式,真實(shí)世界找手感。
- 第一步,仿真打底。AstraBrain里的“小腦模型”,讓機(jī)器手在虛擬環(huán)境中反復(fù)練不同尺寸、不同重量的核桃,靠大規(guī)模試錯(cuò)學(xué)出一套可泛化的“盤核桃策略”。
- 第二步,現(xiàn)實(shí)校準(zhǔn)。真正上手核桃以后,再利用真實(shí)摩擦、結(jié)構(gòu)誤差這些反饋,在線微調(diào)動(dòng)作,把仿真和現(xiàn)實(shí)之間的那點(diǎn)縫補(bǔ)起來。
值得一提的是,小蓋后面給沈騰遞水時(shí)還有個(gè)小彩蛋:機(jī)器人在遞水的同時(shí),還在盤。

這意味著什么?
意味著它已經(jīng)能做到:單手手內(nèi)操作+雙手任務(wù)分工協(xié)同,而這套能力,已經(jīng)非常接近真實(shí)工位里的操作閉環(huán)了。

收玻璃碎片、貨架取物:從“秀技”到“上崗”
接下來呢,就是“智慧腦袋顯身手”的時(shí)刻了。
舞臺(tái)上一個(gè)容易被忽略的細(xì)節(jié):在明暗變化的燈光下,機(jī)器人要把透明、形狀不規(guī)則的酒杯碎片收進(jìn)盒子里。

這里的難點(diǎn)有兩個(gè):
一方面,透明物體本身就難被機(jī)器視覺捕捉;另一方面,不規(guī)則碎片在不同光照下,反光和陰影邊緣都在變。
對(duì)此,小蓋的做法,是先在仿真中“見遍天下碎玻璃”:
通過生成不同厚度、不同破裂形態(tài)、不同光照條件下的海量透明碎片數(shù)據(jù),讓機(jī)器人在虛擬世界中把各種可能情況都見過一遍。
再結(jié)合多模態(tài)感知,從極其微弱的反光和陰影里,判斷碎片具體位置,規(guī)劃抓取。
同時(shí)在接觸過程中,用“觸感”判斷硬度和滑動(dòng)情況,動(dòng)態(tài)調(diào)力度,確保玻璃片既不被捏碎,也不滑落。
這一步,其實(shí)已經(jīng)從展示技巧,跨過了可部署能力的門檻。
再看貨架取物。
這看起來是最普通的動(dòng)作,但恰恰是最接近真實(shí)商業(yè)零售場景,也是銀河通用的“傳統(tǒng)藝能”。
這里的核心難點(diǎn)不在抓,而在決策:擁擠環(huán)境定位目標(biāo)、避免擾動(dòng)鄰近物體,在結(jié)構(gòu)約束下重新規(guī)劃動(dòng)作。
舞臺(tái)上有個(gè)細(xì)節(jié)非常漂亮,你看,機(jī)器人并非是抓住瓶身,而是牢牢地從瓶蓋位置“扣”住,放在桌上。
![]()
用行業(yè)黑話說,就是這affordance找的,真有水平。
而且,這不是預(yù)錄軌跡,而是實(shí)時(shí)決策。每一次扣、每一次傾斜,都在“眼前這一次”重新計(jì)算。
這也意味著,這類能力已經(jīng)從展示層面邁向了真正的操作閉環(huán)。
穿烤腸、疊衣服:動(dòng)作更像人,而不是更像程序
再往后,是穿烤腸、疊衣服這類生活化任務(wù)的綜合考試。
在穿烤腸的過程中,機(jī)器人需要一手操控烤鉗,一手穿簽并遞送,這對(duì)其雙手在空間上的協(xié)同能力、力度上的獨(dú)立控制,以及動(dòng)作節(jié)奏的匹配都提出了要求。
這里有一個(gè)關(guān)鍵能力點(diǎn)——靈巧操作中的Tool use(工具使用)。
這項(xiàng)能力直接決定了機(jī)器人能否真正進(jìn)入流水線崗位,因?yàn)楝F(xiàn)實(shí)世界的大多數(shù)任務(wù),本質(zhì)上都是“借助工具完成”。
在疊衣服時(shí),需要機(jī)器人既要撫平衣角,又要對(duì)折對(duì)齊,對(duì)布料這種“軟家伙”,非常考驗(yàn)機(jī)器人操作的穩(wěn)定性和細(xì)膩度。

這些動(dòng)作之所以看起來越來越“像人手”,本質(zhì)原因在于訓(xùn)練方式發(fā)生變化:
小蓋并不完全依賴機(jī)器人自身采集數(shù)據(jù),而是大量利用人類動(dòng)作數(shù)據(jù)進(jìn)行學(xué)習(xí)與擴(kuò)展。
一方面,人類日常行為的數(shù)據(jù)本身就很豐富;另一方面,通過仿真擴(kuò)展和學(xué)習(xí),機(jī)器人可以在處理柔性物體這類場景中,積累出更自然、更穩(wěn)定的操作經(jīng)驗(yàn)。
所以,當(dāng)它在臺(tái)上撫平衣角、對(duì)折衣服的時(shí)候,本質(zhì)不是在“放一段預(yù)設(shè)程序”,而是在實(shí)時(shí)決策下完成任務(wù),只不過這套決策已經(jīng)被打磨得很接近人類的“手感”。
而這一連串的技能展示,都離不開小蓋背后的大腦——AstraBrain。
AstraBrain:把“聰明腦袋”長在機(jī)器人身上
把復(fù)雜的論文語言抹掉,AstraBrain其實(shí)可以看成是一個(gè)四階段的“具身學(xué)習(xí)框架”:
- 人類樣本示范-仿真數(shù)據(jù)合成-強(qiáng)化學(xué)習(xí)試錯(cuò)-真機(jī)調(diào)微操。
![]()
首先,是少量人類示范提供技能種子。
傳統(tǒng)工業(yè)機(jī)器人,往往需要上千次遙操作數(shù)據(jù)去堆一個(gè)動(dòng)作。
AstraBrain不這么干,它把人類示范當(dāng)作“技能種子”:給機(jī)器人少量的動(dòng)作示范軌跡,建立一個(gè)可泛化的行為先驗(yàn)。

接著,是在仿真環(huán)境中,通過海量仿真數(shù)據(jù)模仿學(xué)習(xí),覆蓋大量現(xiàn)實(shí)中難以窮舉的情況。
現(xiàn)實(shí)世界的數(shù)據(jù),貴、慢又難采。
因此模型訓(xùn)練發(fā)生在高精度物理仿真環(huán)境中,仿真環(huán)境自動(dòng)生成多樣場景配置、隨機(jī)擾動(dòng)光照與物體布局,生成式模型產(chǎn)出抓取動(dòng)作。
第三步是通過仿真環(huán)境的強(qiáng)化學(xué)習(xí)形成最優(yōu)策略。
因?yàn)閮H靠模仿仍難應(yīng)對(duì)精細(xì)操作與動(dòng)態(tài)避障,由此,AstraBrain引入強(qiáng)化學(xué)習(xí)閉環(huán):
機(jī)器人在仿真環(huán)境中進(jìn)行高頻試錯(cuò),成功避障獲得獎(jiǎng)勵(lì),碰撞或失敗受到懲罰。
通過大規(guī)模迭代,策略逐漸收斂到高穩(wěn)定路徑,形成更高效的操作方式。
春晚展示出的流暢控制,很大程度來自這一階段的優(yōu)化。
第四步,通過真機(jī)數(shù)據(jù)完成遷移校準(zhǔn)。
仿真訓(xùn)練完成后,能力需要落地現(xiàn)實(shí)。AstraBrain通過少量真實(shí)操作數(shù)據(jù)進(jìn)行微調(diào):收集真實(shí)接觸與反饋、修正仿真與現(xiàn)實(shí)偏差、完成策略校準(zhǔn)。
這一步的目的是讓機(jī)器人不僅知道“理論上該怎么做”,還知道“以我這副身子骨,動(dòng)作會(huì)被現(xiàn)實(shí)世界修正成什么樣”,從而把盤核桃、轉(zhuǎn)筆這種高接觸靈巧操作,變成穩(wěn)定可復(fù)現(xiàn)的能力。
支撐上述流程的,是銀河通用的數(shù)據(jù)體系——AstraSynth。
![]()
其結(jié)構(gòu)可以理解為三層:
- 基石層(人類數(shù)據(jù)):建立任務(wù)理解與行為認(rèn)知。
- 中間層(仿真合成數(shù)據(jù)):低成本擴(kuò)展能力邊界,跨越虛實(shí)差距。
- 塔尖層(真機(jī)數(shù)據(jù)):用少量高質(zhì)量數(shù)據(jù)完成現(xiàn)實(shí)校準(zhǔn)。
這形成了一條清晰的訓(xùn)練路徑:
用仿真解決數(shù)據(jù)規(guī)模問題,用強(qiáng)化學(xué)習(xí)優(yōu)化動(dòng)作質(zhì)量,再用真實(shí)環(huán)境完成最終閉環(huán)。
因此,這套方法并非只針對(duì)單一任務(wù)。同一能力框架既能用于抓取商品,也能用于盤核桃、疊衣服或工具操作。
從這個(gè)角度看,機(jī)器人并不是學(xué)會(huì)某個(gè)動(dòng)作,而是在逐步獲得快速學(xué)習(xí)新技能的能力。
銀河通用:央視春晚指定具身大模型機(jī)器人
銀河通用這次被央視指定為具身大模型機(jī)器人登上馬年春晚,并非偶然。
作為中國具身智能模型路線的代表性企業(yè)之一,它也是當(dāng)前少數(shù)將模型能力真正落地到真實(shí)產(chǎn)業(yè)場景的公司。
銀河通用成立于2023年5月,兩年多融資超8億美元,最新一輪融資超3億美元,刷新具身智能行業(yè)單輪融資紀(jì)錄,估值突破210億元,穩(wěn)居國內(nèi)具身智能頭部陣營。
在春晚亮相的背后,是銀河通用已形成硬件-模型-生態(tài)的完整閉環(huán):
在硬件層面,Galbot(G1)輪式雙臂本體高效折疊,支持2.4米高摸底觸地,兼顧靈活度與性能迭代;
值得一提的是,銀河通用最新的工業(yè)重載機(jī)器人Galbot S1也在春晚亮相,與衛(wèi)星、航母、C919一同作為“國之重器”展出。

從技術(shù)路線上來看,銀河通用主打“仿真為主、真機(jī)為輔”的虛實(shí)結(jié)合訓(xùn)練管線:
自研仿真系統(tǒng)生成百億級(jí)機(jī)器人干活數(shù)據(jù)集,破解行業(yè)真實(shí)數(shù)據(jù)稀缺難題,實(shí)現(xiàn)Sim2Real無縫遷移,這構(gòu)成了其具身能力擴(kuò)展的底座。
過去一年,銀河通用密集推出GraspVLA(零樣本抓取)、GroceryVLA(零售大模型)、TrackVLA(動(dòng)態(tài)導(dǎo)航)、NavFoM(全域?qū)Ш交┑瘸晒?/p>
由此構(gòu)建起感知理解-空間推理-執(zhí)行控制的全棧具身模型體系,春晚亮相的AstraBrain,正是其最新技術(shù)成果:
在產(chǎn)業(yè)落地層面,銀河通用的版圖已覆蓋工業(yè)、零售、倉儲(chǔ)物流、醫(yī)療康養(yǎng)等多個(gè)領(lǐng)域。
在工業(yè)領(lǐng)域,銀河通用已獲得寧德時(shí)代、極氪等頭部制造企業(yè)千臺(tái)級(jí)訂單,實(shí)現(xiàn)進(jìn)廠部署。
在零售場景,“銀河太空艙”已落地?cái)?shù)100多座城市,自主售賣文創(chuàng)飲料零食。
![]()
在倉儲(chǔ)物流領(lǐng)域,全球首推百臺(tái)級(jí)機(jī)器人7×24小時(shí)自主運(yùn)營零售倉,已穩(wěn)定運(yùn)行超一年。
在醫(yī)療康養(yǎng)領(lǐng)域,與宣武醫(yī)院等三甲機(jī)構(gòu)合作,落地病房、藥房、導(dǎo)診等場景;在2025世界人形機(jī)器人運(yùn)動(dòng)會(huì)中,還以全自主、零遙操作拿下世界冠軍。
這意味著,銀河通用正在把機(jī)器人從實(shí)驗(yàn)室,一步步推向日常生活與真實(shí)產(chǎn)業(yè),構(gòu)建起一張完整的具身智能生態(tài)網(wǎng)格。
而具身智能的下半場,核心比拼的正是模型能力與生態(tài)構(gòu)建。
回顧剛剛過去的具身智能量產(chǎn)元年,行業(yè)格局已迅速收斂:
硬件趨于標(biāo)準(zhǔn)化,真正決定機(jī)器人生產(chǎn)力的,具身模型的操作泛化性,將成為真正的勝負(fù)手。
中國憑借超大規(guī)模市場、豐富應(yīng)用場景與完整產(chǎn)業(yè)鏈,走出了一條“場景牽引、快速迭代、規(guī)模應(yīng)用”的道路。
但毋庸諱言,硬件本體發(fā)展快于具身大腦的格局仍未改變。
而銀河通用,恰好站在這一關(guān)鍵節(jié)點(diǎn)上——
從模型出發(fā),以仿真數(shù)據(jù)與Sim2Real持續(xù)擴(kuò)展技能邊界,將行業(yè)競爭從機(jī)械參數(shù)推向真實(shí)作業(yè)能力。
模型能力的追趕與超越,將成為2026年具身領(lǐng)域最關(guān)鍵的變量。
機(jī)器人春晚十年,中國具身從0到1
最后,說句不太冷的冷知識(shí)。
最早上春晚的機(jī)器人,不是宇樹去年的《秧bot》、也不是21年的《牛起來》,而是10年前的優(yōu)必選。
2016年猴年春晚,540臺(tái)Alpha 1S組成方陣,整齊起舞為孫楠伴唱《沖向巔峰》,創(chuàng)下“最多機(jī)器人同時(shí)跳舞”的吉尼斯世界紀(jì)錄。
那時(shí),OpenAI剛剛成立,一個(gè)月后,AlphaGo戰(zhàn)勝李世石——
AI 3.0曙光初現(xiàn),西方算法與算力全面領(lǐng)跑,中國AI還在硬件追趕、算法仰望的階段。
十年后,2026馬年春晚,機(jī)器人陣容空前——
多家具身智能公司集體登臺(tái)亮相,覆蓋舞蹈、運(yùn)動(dòng)、干活、陪伴各個(gè)場景。
可以說,春晚見證了中國AI從跟跑到并跑領(lǐng)跑的十年躍遷,具身智能作為下一個(gè)十年北極星,也正式進(jìn)入“中國時(shí)間”。
這次登臺(tái)表演干活的銀河通用,正是對(duì)這段路徑的生動(dòng)注腳:
它向世界展示的不僅是一個(gè)企業(yè)的技術(shù)實(shí)力,更是中國具身智能產(chǎn)業(yè)的整體轉(zhuǎn)向:
從攻克運(yùn)動(dòng)控制、展示視覺奇觀,轉(zhuǎn)向解決實(shí)際問題、創(chuàng)造經(jīng)濟(jì)與社會(huì)價(jià)值的新階段。
在億萬觀眾除夕夜的注視下,機(jī)器人穩(wěn)穩(wěn)盤核桃、取貨遞水,為十年的AI追趕畫上階段性休止符。
下一個(gè)十年,具身要干的,是讓這些“會(huì)干活的機(jī)器人”,走進(jìn)每個(gè)工廠、每個(gè)倉庫、每個(gè)家庭,從舞臺(tái)落地生產(chǎn)線,真正激活萬億產(chǎn)業(yè)動(dòng)能。
![]()
最后的最后,說句題外話。
你說這正月十五,還有節(jié)目嗎?
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.