陶大程院士在臺上展示了一段機器狗在復雜工廠環境中自主避障巡檢的視頻。他平靜地解釋道,這背后依賴的不是預編程地圖,而是模型對物理世界的“常識性”理解。“它知道一個晃動的貨箱可能會傾倒,所以會選擇繞行,而不是等它砸下來。”
![]()
大曉機器人(ACE ROBOTICS)的發布會被布置得像一場學術研討會。沒有炫酷的人形機器人跳舞,沒有未來感的CG渲染。臺上PPT的關鍵詞是“數據缺口”、“物理規律”、“世界模型”。商湯科技聯合創始人、大曉董事長王曉剛和首席科學家陶大程,用近乎冷酷的理性,剖析著當前具身智能行業最深的隱痛。
他們拋出了一個令人不安的對比:在智能駕駛領域,特斯拉FSD V14 借助世界模型,每日訓練量相當于人類400萬小時駕駛經驗。而整個具身智能行業擁有的真機數據,僅為可憐的10萬小時。
“這是個斷崖式的缺口。”陶大程說。這意味著,按照傳統“有多少人工,才有多少智能”的路徑,想讓機器人學會疊衣服、抓取生鮮,可能需要人類遙控操作數百年。
在這場關于機器人“智力”的競賽中,最大的瓶頸不是算力,而是喂養AI的“物理世界經驗”。大曉機器人試圖用一種近乎“作弊”的方式,繞過這個看似無解的死結。
01 “為難人”與“為難機器”:現有路徑的“死胡同”
在發布會上,大曉的科學家團隊毫不留情地“炮轟”了行業現行的兩條主流技術路徑。
![]()
第一條是 “以機器為中心”的真機遙操。工程師需要為每一款不同的機器人本體,進行海量的真人遠程操控數據采集。“這本質上是‘為難人’。”陶大程指出,它成本極高、效率極低,產出的“智能”被牢牢綁定在特定硬件上,毫無通用性可言。
第二條是特斯拉、Figure AI等正在探索的 “純視覺學習”。讓機器人像嬰兒一樣,單純通過觀看海量人類視頻來學習動作。“這本質上是‘為難機器’。”這種路徑缺乏對三維物理世界力學規律、觸覺反饋和動作意圖的理解,如同讓人只看無聲默片學開飛機,存在巨大的“現實鴻溝”。
“這兩條路,一條把智能禁錮在軀殼里,另一條讓智能飄在幻象中。”一位現場的技術觀察者如此總結。它們共同的困境,在于無法理解“人所處世界的物理規律和人類行為的因果一致性”。
當行業巨頭們在兩條“死胡同”里投入重金時,大曉選擇回到最原點提問:我們到底需要教會機器人什么?答案是:不是具體的動作,而是理解動作背后的“物理常識”。
02 ACE范式:“以人為中心”的數據革命
大曉的答案,是他們首創的“以人為中心”(Human-centric)的ACE具身研發范式。這個拗口的名詞,核心是一場數據生產方式的革命。
![]()
其關鍵在于“環境式數據采集”。技術團隊不再圍著機器人轉,而是圍繞“人”來構建一套精密的采集系統。通過佩戴在頭、手、身體的跨視角多模態設備,融合視覺、觸覺、語音、力學數據,物理級地建模人類與物體、場景(“人-物-場”)的每一次交互。
“我們采集的不是‘機器人該如何抓杯子’的數據,而是‘人類的手在抓不同材質、形狀、重量的杯子時,肌肉如何發力、觸覺如何反饋、視線如何移動’的全套物理規律。”一位研發人員解釋道。
基于這套高保真、全要素的“人類行為物理數據庫”,大曉訓練出其核心武器——開悟世界模型3.0。
這不是一個單純的動作模仿模型,而是一個“多模態理解-生成-預測”的 “物理規律模擬器”。它不僅能根據指令生成逼真的交互視頻,更能“預測”一個動作可能引發的無數種物理后果。比如,它能推演出“推倒一個半滿的紙箱”與“推倒一個裝滿金屬零件的紙箱”會產生怎樣不同的軌跡和結果。
這意味著,開發者可以在模型生成的、符合物理規律的無限虛擬場景中訓練機器人,而無需消耗寶貴的真機時間和高昂的試錯成本。 大曉宣稱,這一范式能將數據采集效率提升至“一年千萬小時”,并通過世界模型放大,達到“上億小時”的訓練效果。
![]()
03 “超級大腦”模組與開放生態:從實驗室到工廠的“最后一公里”
有了理解物理世界的“靈魂”,還需要能自主行動的“身體”。大曉發布了 “具身超級大腦模組A1” ,將其定義為機器人的“小腦”和“腦干”。
![]()
這個模組的核心能力是“純視覺無圖端到端”的自主移動與決策。搭載A1的機器狗,無需預先采集高精地圖,就能在動態、陌生的復雜環境(如工廠、電站)中,實時理解自然語言指令(如“去檢查第三號設備柜的左側”),并規劃出安全合理的路徑。
![]()
“它知道一個晃動的貨箱可能會傾倒,所以會選擇繞行。”陶大程用這個例子說明,基于世界模型的“常識”已灌注到實時決策中。
更具戰略眼光的,是大曉的 “開放生態”布局。他們不僅將開悟世界模型3.0開源,更宣布已與沐曦、壁仞等國產芯片,智元、銀河通用等機器人本體公司,以及騰訊云、火山引擎等云服務商達成深度合作。
![]()
這構建了一個清晰的產業分工:大曉專注于提供最底層的“世界模型”和“智能模組”(大腦),而芯片商、硬件商、場景方則各司其職,共同完成落地。 這規避了機器人公司“既要造大腦,又要造身體,還要找場景”的全棧重負,試圖以“操作系統”般的角色,加速整個產業的商業化進程。
結語
大曉機器人的發布會沒有提供關于“機器人何時進入家庭”的樂觀時間表。相反,它用嚴謹甚至略顯枯燥的技術語言,揭示了通往通用具身智能道路上最堅實的一塊絆腳石——物理常識的缺失,以及填充這一空白所需的、海量且高質量的“物理交互數據”。
![]()
當同行們或沉醉于讓機器人復刻人類舞蹈,或執著于真機在實驗室完成特定任務時,大曉選擇了一條更底層、更艱難,但也可能更根本的路徑:先讓AI透徹地理解重力、摩擦力、材質剛度、動量守恒,理解人類意圖與物理結果之間的因果鏈條。
王曉剛在結尾說:“我們的使命是讓機器人擁有聰明的‘大腦’和有趣的‘靈魂’。” 而這場發布會讓人們看到,所謂“有趣的靈魂”,其基礎恰恰是對枯燥物理定律的深刻敬畏與精準建模。
![]()
這場競賽的終局,或許不屬于那些能最快做出炫酷Demo的公司,而屬于那些能最有效率地教會AI理解我們所在的這個粗糙、復雜、充滿意外,但又嚴格遵循規律的三維物理世界的“授業者”。大曉的ACE范式,正是一次成為“授業者”的野心嘗試。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.