出品|網易科技《態度AGI》對話第47期
作者|崔玉賢
編輯|丁廣勝
“2026年我們要建成100萬小時的具身真機數據產能,我們目標是建成全球最大的具身真機數據集。”鹿明創始人喻超表示。
從2025年的10萬小時數據集采產能到2026年100萬小時,這不是大躍進,而是鹿明機器人獨有技術優勢下的絕對自信。
2026年開年,鹿明機器人召開了一場溝通會,帶來了其自主研發的FastUMI Pro(無本體模仿學習)數據采集系統。UMI是一種通過便攜式設備在真實環境中采集人類操作數據的技術,用于訓練具身智能機器人,具有低成本、高兼容性和高效率等核心優勢。
曾經這是一種比較冷門的具身智能集采方式,而現在卻逐漸成為主流。鹿明機器人聯席CTO丁琰是國內最早研究和推動UMI這種數據采集方式的從業者,從2024年博士畢業后就開始從事相關研究工作。如今,終于成為具身智能主流的數據集采方式。
據介紹,與傳統遙操作采集方式相比,FastUMI Pro通過創新的硬件架構與軟件算法,將單條數據采集時間從50秒縮短至10秒,效率提升5倍,同時將綜合成本降至傳統方法的五分之一。更重要的是,該系統實現了數據與機器人本體的解耦,可快速適配市場上數十種不同的機械臂和夾爪,有效打破了數據孤島。
在丁琰看來,數據、算法、硬件是非常強耦合的系統,任何單點的失效都會導致一個優秀的模型不可能誕生。“數據決定模型的性能,硬件決定數據的質量,數據又會決定算法的性能,算法又反向約束硬件的執行和數據的設計。所以說這三環息息相關。”
這也是為什么有些公司采用UMI的數據集采方式產生了很多“廢數據”,模型訓練不好的原因。但鹿明機器人的FastUMI Pro從一開始就是為了模型的成功去做。
FastUMI Pro集成了為UMI場景定制的高性能傳感器,能穩定實現60Hz高頻記錄,確保多模態信息的毫秒級同步。配合鹿明獨創的8道工業級數據質量評估體系,從采集源頭淬煉出“高純度黃金數據”,使數據有效率從行業普遍的70%提升至95%。
據了解,鹿明機器人的數據集采標準不僅高于行業標準,而且高于個別企業提出的高要求。目前,全球具身智能圈內,有超過三分之二的頂尖團隊,正在使用FastUMI Pro。
據悉,鹿明機器人的數據采集業務海內外客戶已有幾十家,包括全球最領先的具身智能算法公司和頂尖大學實驗室等,目前公司數據采集與交付能力已接近滿載。
在談到營收時,鹿明機器人創始人兼CEO喻超認為2026年的目標將是9位數。
![]()
以下為網易科技等與鹿明機器人創始人兼CEO喻超、鹿明機器人聯合創始人趙廣智以及鹿明機器人CTO丁琰溝通的部分內容:
提問:鹿明的數據質量標準與行業標準的差異?
丁琰:其實我們已經陸陸續續收到好多家不同類型客戶的標準,我們在給客戶交付的時候,數據質量都能夠符合、甚至遠高于客戶的標準。
提問:PPT演示中有非常完整UMI這種數據采集平臺,也有很多本體的落地,在模型層面似乎沒有看到太多的展示,鹿明在模型這塊的規劃是什么?
丁博:做任何事都會有自己的timeline。我就是做模型出身的,我之前一直在訓模型,當時我們在做的時候就發現一個很大的問題——要想訓一個非常好的模型,必須要有一個很好的數據管線,包括數據生產、數據評估、數據篩選,建立的過程本身就需要時間。
我們團隊當時就決定,二選一的話肯定先選數據,不能上來就干模型,還希望把數據做到最極致。
因為模型架構拼到最后,大家拼的不是模型架構,而是模型數據的質量,這是一個行業公共的認知。到目前為止我們的數據管線已經完全搭建成功了,可以源源不斷產生非常好的數據,目前階段我們不會去訓模型。
提問:具身智能企業采用了UMI的方式訓練了之后,他們本身的模型能力,包括泛化性有哪些比較顯著的提升?
丁琰:因為UMI本身最近才熱起來的一個詞,我雖然做的很早,但是整個行業做的其實挺晚的。應該是在2025年9月份左右。 之前用的更多是遙操作,或者是一些數據去訓自己的模型,現在大家逐步的才去買我們的設備,用我們的數據,可能未來三個月也會陸陸續續看到用我們的數據訓出的模型,馬上就要開源或者是發布一些新聞。
提問:從投資的角度展望一下2026年具身智能的融資熱會熱到哪些環節?
趙廣智:坦率的說,雖然我做投資出身,但是現在已經不做投資了。我們目前思考問題的方式,其實不太按照這個方式去思考,我們更多的考慮到是在終局的時候這個行業需要什么。那毫無疑問一定是需要通用的具身智能體,那一定是數據。
數據、硬件和場景這三方面的能力是都要具備的。如果達到這樣的未來,對我們來說其實很清晰,那就是數據是現在最重要的基礎設施,我們把數據去夯實,然后在場景里面把通過數據基礎設施的夯實,再去做場景的結合和落地。落地的時候自然結合我們的硬件,帶動我們硬件的規模化,這個路線我們內部是非常清楚的。 提問:各家機器人公司在本體模型,數據、場景等能力都在布局,但是各家的側重點可能是不太一樣的。您認為說當下最重要的能力是什么?這幾個能力的優先級是什么?
喻超:這三個要素里面,從原則來看肯定都是足夠重要的,只是說各家卡位點不完全一樣。對我們來說,早期的時候一定是數據,然后再加上跟場景,然后適配硬件。
提問:未來一年鹿明要做到多少營收?什么時候做到一個盈虧平衡?或者說我們要做多大的利潤?
喻超:我們內部肯定是有關于這樣的規劃。但是我坦誠說一點整個行業包括我們在內眼光要放的更長線一點,應該錨定怎么去實現最終的通用智能。
營收的事我們很有信心的,今年我們的營收目標肯定是九位數。
提問:鹿明在To C方面產品的構想是什么?
喻超:團隊有做 To C 產品的這種經驗的,但當前不是公司的戰略重點。
提問:鹿明成立到現在到未來的終局,目前正處于哪個階段呢?
喻超:蓬勃發展的早期。
提問:數據庫的話,采集過程中最難的是什么?是人還是流程?
丁琰:人,人還是人,流程只是為了人去設計的。建素材場的時候就會意識到很大的問題,人是最難管理的,非常非常難管理,他會有很多噪聲。就舉個例子,當時在給智元做數采顧問的時候,他們有一個任務,說機器人把門把手抓起來,然后推過去關上門,然后有些人他就會直接一推。結果達到了,但不是我們規定設計的任務,這種數據就很難訓。
