作者丨蘇建勛
在具身智能領域,“搞數據”這個事兒,可能是為數不多的共識。
依靠訓練巨量數據,大語言模型誕生了Chatgpt,“Scaling Law”也成了AI人的信仰,可在具身智能所屬的物理世界,沒有互聯網上海量的數據參照。不論是人,還是機器人,在現實中的數據量,都不足以復現GPT時刻。
所以,數據怎么搞,能搞到多少,以及要讓數據有質量,就成了具身智能從業者當下最重要的工作之一。
最近,就有一家機器人公司想在數據采集上“整點花活兒”。鹿明機器人發布了全球首款背包版UMI數采設備FastUMI Pro(背包版),并計劃在2026年投放1萬臺設備,在工業、家庭、酒店、餐館、商場、辦公等六大真實場景開展系統性數據采集。
全球首款背包版UMI數采設備:鹿明FastUMI Pro(背包版)
簡單解釋一下“UMI(通用操作接口)”:UMI是斯坦福大學、哥倫比亞大學與豐田研究所聯合提出的低成本數據收集與學習框架。區別于市場同行的遙操數采,UMI可以與機器人本體解耦,這就意味著訓練出的數據,可以不僅適用于某一家/個機器人形態。
在2026年初的一次媒體交流會上,鹿明機器人創始人兼CEO喻超也聊到UMI和遙操的效率與成本對比:
“同樣是像疊衣服這樣的事情,遙操作數據采集,需要花 50 秒,成本是3-5元,如果是用FastUMI Pro的方式去采集,只要 10 秒,成本<0.6元,這樣的話其實采集的效率能大大提升,成本更低。”
鹿明機器人成立于2024年9月,創始人喻超是前追覓具身機器人業務負責人,擁有近10年具身機器人研發經驗,主導了小米CyberDog的研發和千臺量產。聯席CTO丁琰是大陸最早做UMI的人,首次將UMI從實驗室帶向工業界。
有量,也要有質
2025年,鹿明通過自建數采中心的方式,已實現10萬小時的數據產能。喻超判斷,2026年,頭部具身模型的數據規模預計100萬小時起。
而鹿明在2026年最重要的目標,就是建立年采集百萬小時的UMI數據產能。這意味著,鹿明需要用更具規模化的手段,采集更多數據。
“機器人訓練數據本不應該如此昂貴和稀缺。人類在物理世界作業過程中產生的數據無處不在,只是沒有被很好地收集。”喻超表示。
背包版FastUMI正是為解決這一問題而生——它是一款便攜的標準數采工作站,可將真實場景操作高效轉化為高質量訓練數據。
此前具身數據采集,大多依靠實驗室或單一場景采集,這就會導致一個問題:機器人在采集時往往只在一個場景下重復幾個動作,這樣得到的數據就會缺乏多樣性,也會影響模型的泛化能力。
因此,鹿明機器人希望采用更輕便的數據采集方式,將采集工具直接裝進背包,讓真實場景的數據采集門檻更低。
在具體場景上,鹿明機器人希望覆蓋工業、家庭、酒店、餐館、商場、辦公六大核心場景,細分30個小類任務,構建結構化、多維度的操作數據體系。
“采–訓–推”一體化閉環能力是鹿明數據基礎設施的核心。此次規模化數據采集的啟動,正依托于這一已全面打通的基建體系:依托FastUMI Pro,鹿明雙臂具身機器人MOS在5小時內完成從“數據采集-策略訓練-模型推理”的工廠質檢全流程驗證;FastUMI Pro在合肥實地部署后,僅用7小時便跑通真實場景下的采集、訓練與部署推理。
![]()
FastUMI Pro在分揀零部件任務中,完成“數據采集-策略訓練-模型推理”閉環
要訓模型,數據先行
有了背包式的采集工具以外,鹿明還做了一件事,他們建了一個“數據超市”,把采集到的數據變成了可以流通的標準產品,讓客戶可以直接在官網上采購標準化操作數據。可以看出,作為一家具身智能公司,鹿明當下的公司戰略重點,都圍繞“數據”。
鹿明機器人的一系列動作背后,實際上反映了具身智能當下“最痛”的業務需求。
在年初的媒體溝通會上,鹿明機器人聯席CTO丁琰就對《智能涌現》等媒體分享了他對于數據和模型的感悟。
“我就是做模型出身的,我之前一直在訓模型,當時我們在做的時候就發現一個很大的問題。“丁琰說到,”要想訓一個非常好的模型,必須要有一個很好的數據管線,包括數據生產、數據評估、數據篩選,建立的過程本身就需要時間。“
在摸清行業真實發展現狀后,丁琰和團隊當時就決定,模型和數據二選一的話,肯定先選數據,不能上來就訓模型。
”因為模型架構拼到最后,大家拼的不是模型架構,而是模型數據的質量,這是一個行業的共識。“丁琰說到。
具身智能的能力上限高度依賴真實操作數據的規模與質量,當通用數據可以像硬件一樣在線下單,行業模型訓練門檻被顯著拉低,具身智能才能從定制化探索走向工程化生產。
從“萬臺設備同步開采”到“通用數據電商下單”,鹿明正將“無處不在卻未被收集”的物理世界操作數據,變為可規模供給的標準化基礎設施,并以此構建數據驅動的生態系統。當數據不再稀缺,機器人才真正走向通用。
end
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.