編者按:他們創(chuàng)辦的公司或已是獨角獸,或剛啟動種子輪,或已家喻戶曉,或長期身居幕后,或正起于微末,但他們都是中國新經(jīng)濟的微觀脈搏,是這輪產(chǎn)業(yè)和技術(shù)升級的微觀主導(dǎo)者和實踐者,不同行業(yè)成千成萬的他們的身影匯聚,投射變革的洪流。
由財聯(lián)社和《科創(chuàng)板日報》聯(lián)合發(fā)起的 “連線創(chuàng)始人/CEO”欄目,主要關(guān)注創(chuàng)新創(chuàng)業(yè)型企業(yè),以企業(yè)創(chuàng)始人/CEO的訪談為一手信源,讓成長中的創(chuàng)業(yè)公司走入公眾和市場視野,并發(fā)掘最新技術(shù)和產(chǎn)業(yè)趨勢。
《科創(chuàng)板日報》1月13日訊(記者 李明明) 具身智能的下半場,競爭焦點已聚焦具身數(shù)據(jù)。
2026年CES展上,黃仁勛拋出重磅論斷:“機器人的ChatGPT時刻正在到來”,同時直言“脫離真實世界的數(shù)據(jù),具身智能終將淪為幻覺”。這一觀點迅速引爆全球科技產(chǎn)業(yè),釋放明確信號:機器人行業(yè)正告別單一任務(wù)編程、依賴真實場景數(shù)據(jù)卻效率低下的舊階段,全面邁入以物理AI為核心的通用化發(fā)展爆發(fā)期。
事實上,國內(nèi)資本早已敏銳捕捉到這場產(chǎn)業(yè)變革浪潮。2025年下半年,行業(yè)完成范式升級,競爭維度從單一本體,升級為“本體+數(shù)據(jù)”雙核驅(qū)動,更邁向“數(shù)據(jù)×模型×本體”協(xié)同發(fā)力的新階段。
當(dāng)前,具身智能領(lǐng)域在不同技術(shù)階段與場景約束下,正并行推進四條核心數(shù)據(jù)路線,且每條路線均已形成清晰技術(shù)邏輯與產(chǎn)業(yè)落地方向:一是遙控真機路線,依托真實機器人執(zhí)行任務(wù)獲取數(shù)據(jù),場景貼合度與數(shù)據(jù)真實性無可替代,但研發(fā)部署成本居高不下;二是仿真數(shù)據(jù)路線,憑借算力與仿真引擎生成海量合成數(shù)據(jù),拓展性極強,卻受限于仿真與現(xiàn)實的域差難題,難以完全適配真實應(yīng)用;三是人類視頻路線,通過采集大規(guī)模人類行為視頻提取數(shù)據(jù),成本與落地門檻最低,卻易因場景還原度不足陷入應(yīng)用誤區(qū);四是UMI數(shù)據(jù)路線,構(gòu)建無本體依賴的通用化數(shù)據(jù)協(xié)議,打破硬件壁壘實現(xiàn)數(shù)據(jù)復(fù)用,通用性與適配性優(yōu)勢突出。
四條路線并行背后,國內(nèi)具身智能賽道產(chǎn)業(yè)格局已初步清晰,智元機器人、銀河通用、它石智航、鹿明機器人憑借各自主攻路線的深耕布局,成為業(yè)內(nèi)公認的“具身數(shù)據(jù)四小龍”。其中,2024年9月成立的鹿明機器人,是國內(nèi)布局UMI路線的先行者,率先推動通用化數(shù)據(jù)協(xié)議的場景落地。
海量、高質(zhì)量的真機交互數(shù)據(jù),是訓(xùn)練高性能機器人模型的核心基石,而行業(yè)長期受困于數(shù)據(jù)采集成本高、效率低,以及不同機器人本體數(shù)據(jù)無法互通的“數(shù)據(jù)孤島”難題。鹿明機器人精準捕捉這一核心瓶頸,將突破方向錨定數(shù)據(jù)采集基礎(chǔ)設(shè)施,其自主研發(fā)的FastUMI Pro無本體模仿學(xué)習(xí)數(shù)據(jù)采集系統(tǒng),成為破局關(guān)鍵。
《科創(chuàng)板日報》記者近日對話鹿明機器人創(chuàng)始人、CEO喻超,及公司聯(lián)席CTO丁琰。其中,喻超曾任追覓具身機器人(Magic Lab)業(yè)務(wù)負責(zé)人,并首創(chuàng)全球首個空翻電驅(qū)動人形機器人。而其聯(lián)合創(chuàng)立的鹿明機器人,正通過提供從數(shù)據(jù)采集設(shè)備、高質(zhì)量數(shù)據(jù)集、行業(yè)解決方案到聯(lián)合模型訓(xùn)練的全棧服務(wù),構(gòu)建完善的UMI數(shù)據(jù)生態(tài)體系。
喻超表示,相較傳統(tǒng)遙操作采集方式,鹿明FastUMI Pro通過創(chuàng)新硬件架構(gòu)與軟件算法,將單條數(shù)據(jù)采集時長從50秒壓縮至10秒,效率提升5倍,綜合成本降至傳統(tǒng)方法的五分之一;更關(guān)鍵的是,該系統(tǒng)實現(xiàn)了數(shù)據(jù)與機器人本體的解耦,可快速適配市面數(shù)十種不同機械臂、,有效打破了行業(yè)數(shù)據(jù)孤島困境。
“我相信2026年頭部模型公司訓(xùn)練數(shù)據(jù)的規(guī)模一定是去年十倍以上的量級,整個具身數(shù)據(jù)市場相比去年一定是十倍以上的增長。”
![]()
UMI相比傳統(tǒng)數(shù)據(jù)采集方案效率提升5倍,成本降至1/5
《科創(chuàng)板日報》:幾年前UMI項目在學(xué)術(shù)界、產(chǎn)業(yè)界都相對冷門,當(dāng)時為什么選擇堅持做這個項目?
丁琰:2024年3月我們開始啟動UMI項目時,全球范圍內(nèi)從事該領(lǐng)域的團隊寥寥無幾,由于技術(shù)難度較高,很多團隊都中途放棄了,在推進過程中,我們越來越堅信這個項目的價值和前景,最終取得了一個又一個的階段性成果。
首先就是FastUMI,我們從2024年3月左右開始做這個工作,中了當(dāng)年的CoRL 2025,將學(xué)術(shù)界工作帶入了工業(yè)界。
另外一個工作是FastUMI 100K。我們團隊因此獲得了大規(guī)模的數(shù)據(jù)治理經(jīng)驗。
UMI領(lǐng)域的真正門檻并非設(shè)備本身,而在于能否采集到“可訓(xùn)練”的高質(zhì)量數(shù)據(jù)。市面上許多UMI設(shè)備采集的數(shù)據(jù)存在視覺與位姿未對齊、傳感器不同步、軌跡不可復(fù)現(xiàn)(replay)等問題,實為無法用于有效訓(xùn)練模型的“廢數(shù)據(jù)”。對此,鹿明首創(chuàng)了“為模型成功率負責(zé)”的系統(tǒng)工程范式,從硬件設(shè)計源頭保障數(shù)據(jù)質(zhì)量。
《科創(chuàng)板日報》:UMI在成本降低方面有哪些表現(xiàn)?其市場定位和市場份額變化趨勢是怎樣的?
丁琰:UMI在成本控制上優(yōu)勢明顯,若不考慮機器人本體成本,其采集效率相比傳統(tǒng)數(shù)據(jù)采集方案提升5倍,成本降低1/5;若計入本體成本,成本降低幅度更大,可達1/100甚至1/200。
從第一性原理來看,人手的采集效率最高,而UMI的采集效率已達90%,接近人手水平,因此被認為是數(shù)據(jù)采集的終極解決方案。
市場份額方面,過去幾年遙操作的市場份額達95%以上;但從2025-2026年開始,UMI方案會迎來爆發(fā)式增長。
《科創(chuàng)板日報》:遙操作與UMI設(shè)備在數(shù)據(jù)維度上有什么差異?兩者的適配算法有何不同?目前公司的客戶合作情況如何?
丁琰:兩者的數(shù)據(jù)維度差異不大,但適配的算法有所區(qū)別,遙操作的畫面維度稍高,傳感器數(shù)量與現(xiàn)行UMI設(shè)備不同,算法也從關(guān)節(jié)預(yù)測轉(zhuǎn)向末端預(yù)測。UMI的適用場景范圍較大,可廣泛應(yīng)用于各類具身智能公司。
我們跟三菱、中遠海運、德馬科技形成了比較深度的戰(zhàn)略合作。在場景里面落地的過程中,數(shù)據(jù)規(guī)模化又能帶來智能化的提升。
目前全球具身智能行業(yè)內(nèi)有超過三分之二的團隊,正在使用FastUMI Pro,2026年這一比例還會進一步提升。
《科創(chuàng)板日報》:UMI數(shù)據(jù)采集工廠的環(huán)境設(shè)計有什么要求?不同任務(wù)的采集環(huán)境是否存在差異?
丁琰:高質(zhì)量的UMI數(shù)據(jù)采集依然需要嚴密的物理空間設(shè)計,甚至有著極其嚴苛的規(guī)則限制。如果無限制、無規(guī)則地自由發(fā)揮,產(chǎn)生的數(shù)據(jù)一致性將極差,最終導(dǎo)致模型無法收斂。這些關(guān)于空間設(shè)計的約束和技巧,是我們最核心的競爭力之一。
不同任務(wù)的數(shù)據(jù)采集環(huán)境存在明顯差異,例如桌面級任務(wù)和移動操作任務(wù),會采用不同的裝置和采集規(guī)則。我們會制定一套復(fù)雜的空間引導(dǎo)規(guī)則,通過軟硬件結(jié)合的方式,確保采集過程既具備現(xiàn)實世界的豐富度,又符合模型訓(xùn)練所需的邏輯一致性。
目前鹿明已有三個數(shù)據(jù)采集工廠,持續(xù)輸出百萬小時級的高質(zhì)量具身數(shù)據(jù)。
《科創(chuàng)板日報》:UMI在產(chǎn)業(yè)內(nèi)的角色定位是怎樣的?對于不同規(guī)模的企業(yè)(中小企業(yè)、初創(chuàng)企業(yè)、大公司)分別有什么價值?
喻超:對于中小企業(yè)和初創(chuàng)企業(yè)而言,UMI因成本較低、數(shù)據(jù)質(zhì)量高,是很好的選擇;對于大公司來說,隨著模型規(guī)模擴大,對數(shù)據(jù)量的需求達到海量級別,遙操作數(shù)據(jù)的成本過高,此時UMI大概率會成為更高效的解決方案,推動產(chǎn)業(yè)分工的升級。
計劃在2026年實現(xiàn)100萬小時的真機數(shù)據(jù)產(chǎn)能
《科創(chuàng)板日報》:公司在模型發(fā)展上有哪些策略?現(xiàn)階段的模型規(guī)劃是怎樣的?
丁琰:我就是做模型出身的,我們在做的時候就發(fā)現(xiàn)——要想訓(xùn)一個非常好的模型,必須要有一個很好的數(shù)據(jù)管線,包括數(shù)據(jù)生產(chǎn)、數(shù)據(jù)評估、數(shù)據(jù)篩選,建立的過程本身就需要時間。
因此我們認為,不能上來就訓(xùn)模型,而是要把數(shù)據(jù)做到最極致。因為模型拼到最后,拼的不是模型架構(gòu),而是模型數(shù)據(jù)的質(zhì)量,這是一個行業(yè)的共識。
目前我們的數(shù)據(jù)管線已搭建完成,可以源源不斷地產(chǎn)生優(yōu)質(zhì)數(shù)據(jù)。
現(xiàn)階段我們不會訓(xùn)練自有預(yù)訓(xùn)練模型,而是選擇與產(chǎn)業(yè)方合作開發(fā)應(yīng)用模型。
![]()
《科創(chuàng)板日報》:公司在數(shù)據(jù)量累積上有什么目標?目前的產(chǎn)能能否支撐該目標實現(xiàn)?
喻超:2026年頭部模型公司訓(xùn)練數(shù)據(jù)的規(guī)模一定是去年十倍以上的量級,整個具身數(shù)據(jù)市場相比去年一定是十倍以上的增長。
為了應(yīng)對市場需求的爆發(fā),我們正在通過與政府/產(chǎn)業(yè)方合作建設(shè)數(shù)采工廠等方式,加速建設(shè)數(shù)據(jù)采集產(chǎn)能,預(yù)計2026年實現(xiàn)超過100萬小時的UMI數(shù)據(jù)采集產(chǎn)能,目標是建成全球最大的具身真機數(shù)據(jù)集。
《科創(chuàng)板日報》:目前公司面臨的數(shù)據(jù)質(zhì)量評估標準有哪些?公司的數(shù)據(jù)質(zhì)量處于什么水平?
丁琰:我們將“可復(fù)現(xiàn)”作為數(shù)據(jù)治理的第一性原理,首創(chuàng)8道工業(yè)級數(shù)據(jù)質(zhì)量評估體系,只交付100%可復(fù)現(xiàn)數(shù)據(jù)。
我們陸續(xù)收到了很多不同類型客戶的數(shù)據(jù)質(zhì)量評估標準,我們在給客戶交付的時候,數(shù)據(jù)質(zhì)量不僅符合這些標準,還遠超要求。
比如工信部規(guī)定畫面分辨率需達到640×640以上、頻率30赫茲,幀率穩(wěn)定性2赫茲;而我們實際的指標分別為1280×1280、60赫茲,幀率穩(wěn)定性更是達到1赫茲左右,在構(gòu)建生態(tài)和市場推廣過程中,這一優(yōu)勢為產(chǎn)品競爭提供了有力支持。
《科創(chuàng)板日報》:數(shù)據(jù)與模型的適配、模型與本體的泛化都十分重要,能否具體解釋你們是如何開展這兩項工作的?
丁琰:這其中的交互比想象中更為復(fù)雜,核心可分為數(shù)據(jù)、模型、硬件(本體,非數(shù)采硬件)三大板塊,同時數(shù)采硬件也起到關(guān)鍵作用。
數(shù)采硬件直接決定數(shù)據(jù)質(zhì)量,而數(shù)據(jù)質(zhì)量又會影響模型的智能上限,若數(shù)據(jù)質(zhì)量不佳,模型訓(xùn)練必然難以達到理想效果。當(dāng)數(shù)據(jù)與模型完成適配后,還需部署到本體硬件上,若硬件本體性能不足,模型的實際效果也無法充分發(fā)揮。三者之間是相互影響、相互促進的關(guān)系。
這也是我們專門為UMI研發(fā)專屬機械臂的原因。我們即將發(fā)布一款最適配UMI數(shù)據(jù)的輕量型機械臂,希望通過算法與硬件的深度耦合,
讓數(shù)據(jù)、模型與硬件形成最佳配合,將整體性能與表現(xiàn)推向極致。
《科創(chuàng)板日報》:之前了解到你們的技術(shù)路徑在本體泛化性上表現(xiàn)突出,具體是如何實現(xiàn)的?
丁琰:以夾爪采集設(shè)備為例,我們的采集設(shè)備分為手持設(shè)備和機載設(shè)備。像宣傳片中展示的那樣,手持設(shè)備的夾爪上配備了攝像頭,會記錄夾爪的外觀畫面,同時還可搭載其他傳感器。
在實際部署時,只要機器人夾爪的外觀與攝像頭參數(shù)和手持設(shè)備一致,無論所搭配的機械臂類型如何,采集到的數(shù)據(jù)都可以相互共用,這就實現(xiàn)了物理層面的本體泛化。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.