![]()
靈初智能、穹徹智能、浙江人形、智平方聯(lián)合投資。
作者丨高景輝
編輯丨林覺(jué)民
2026年以來(lái),具身智能依舊是一級(jí)市場(chǎng)最受關(guān)注的賽道之一。融資消息不斷、玩家持續(xù)增加,圍繞本體、模型、場(chǎng)景和應(yīng)用的競(jìng)爭(zhēng)也在快速升溫。
但在這股熱潮中,有一家公司顯得有些不同。
它成立時(shí)間不長(zhǎng),切入的也不是最容易被資本講述的機(jī)器人本體或基礎(chǔ)模型,而是具身智能里一條更底層、也更難標(biāo)準(zhǔn)化的鏈路:數(shù)據(jù)基礎(chǔ)設(shè)施。
這家公司名為智域基石。
近日,智域基石完成數(shù)千萬(wàn)元天使輪融資,投資方包括靈初智能、穹徹智能、浙江人形、智平方、紫江集團(tuán)控股的紫竹高新區(qū)旗下VC投資管理平臺(tái)小苗朗程。對(duì)一家成立不久的創(chuàng)業(yè)公司來(lái)說(shuō),這樣的投資方結(jié)構(gòu)頗具代表性:在傳統(tǒng)財(cái)務(wù)投資機(jī)構(gòu)大規(guī)模下場(chǎng)之前,產(chǎn)業(yè)方已經(jīng)率先給出了自己的判斷。
智域基石對(duì)外的定位是具身智能數(shù)據(jù)基礎(chǔ)設(shè)施服務(wù)商。它既不做機(jī)器人本體,也不直接做基礎(chǔ)模型,而是試圖圍繞數(shù)據(jù)入口、數(shù)據(jù)編譯和訓(xùn)練輸入,搭建一層面向具身智能時(shí)代的底層能力。據(jù)公司介紹,成立不到半年,其已積累近億元在手項(xiàng)目與合作儲(chǔ)備。
那么,為什么是一家做“數(shù)據(jù)基礎(chǔ)設(shè)施”的公司,率先獲得了多家具身智能產(chǎn)業(yè)方的投資?在本體和模型之外,這條看似不那么顯眼的賽道,為什么開(kāi)始被重新審視?
01
三位核心高管,拼出一套交叉能力
從團(tuán)隊(duì)背景看,智域基石的管理層配置有明顯的“交叉學(xué)科”特征。
核心管理團(tuán)隊(duì)由創(chuàng)始人兼 CEO 楊哲軒、CTO 徐良威、COO 張計(jì)業(yè)等人組成,覆蓋了大數(shù)據(jù)基礎(chǔ)設(shè)施、機(jī)器人技術(shù)和商業(yè)運(yùn)營(yíng)等多個(gè)方向。
楊哲軒擁有分布式數(shù)據(jù)庫(kù)與大數(shù)據(jù)產(chǎn)業(yè)經(jīng)驗(yàn),曾任職于 PingCAP,長(zhǎng)期從事海量數(shù)據(jù)基礎(chǔ)設(shè)施與商業(yè)化體系建設(shè),負(fù)責(zé)公司戰(zhàn)略規(guī)劃、組織管理與業(yè)務(wù)判斷。
CTO 徐良威具備機(jī)器人領(lǐng)域的學(xué)術(shù)與產(chǎn)業(yè)背景,曾在騰訊、鵬行智能等機(jī)構(gòu)從事機(jī)器人軟硬件與具身智能相關(guān)工作,目前主要負(fù)責(zé)技術(shù)研發(fā)、硬件方案設(shè)計(jì)以及數(shù)據(jù)標(biāo)準(zhǔn)相關(guān)工作。
COO 張計(jì)業(yè)則長(zhǎng)期負(fù)責(zé)產(chǎn)業(yè)合作與商業(yè)化落地,當(dāng)前聚焦場(chǎng)景拓展、政企合作與客戶交付。
在組織設(shè)計(jì)上,智域基石采用了更偏“分工式”的技術(shù)架構(gòu):一側(cè)聚焦機(jī)器人技術(shù)適配,另一側(cè)聚焦數(shù)據(jù)編譯系統(tǒng)與大數(shù)據(jù)基礎(chǔ)設(shè)施。這樣的安排,某種程度上也是由行業(yè)特性決定的。
具身智能的數(shù)據(jù)問(wèn)題,本身就不是一個(gè)單點(diǎn)技術(shù)問(wèn)題。
它既涉及機(jī)器人本體、傳感器、操作任務(wù)和物理環(huán)境,也涉及海量數(shù)據(jù)的采集、存儲(chǔ)、調(diào)度、檢索和交付。換句話說(shuō),這不是單靠機(jī)器人團(tuán)隊(duì)或單靠數(shù)據(jù)工程團(tuán)隊(duì)就能完成的工作,而是兩套能力的疊加。
02
為什么具身智能首先卡在“數(shù)據(jù)”上?
談及創(chuàng)業(yè)起點(diǎn),楊哲軒給出的判斷很明確:具身智能當(dāng)前的瓶頸,不只是模型和算力,更在于高質(zhì)量交互數(shù)據(jù)的供給能力。
這也是具身智能和互聯(lián)網(wǎng)模型最根本的差異之一。
文本模型可以直接利用互聯(lián)網(wǎng)中已經(jīng)高度結(jié)構(gòu)化、被人類長(zhǎng)期“編碼”過(guò)的數(shù)據(jù);而機(jī)器人面對(duì)的是物理世界中的原始記錄——視頻、IMU、關(guān)節(jié)狀態(tài)、力反饋、環(huán)境變化、任務(wù)結(jié)果,這些數(shù)據(jù)天然具有多模態(tài)、強(qiáng)時(shí)序、強(qiáng)耦合、異步采樣等特征,且必須與任務(wù)目標(biāo)、動(dòng)作結(jié)果和環(huán)境反饋綁定,才能真正進(jìn)入訓(xùn)練流程。
因此,對(duì)具身模型而言,真正有價(jià)值的并不只是“數(shù)據(jù)量”,而是那些帶有任務(wù)意圖、動(dòng)作邊界、成功/失敗結(jié)果和部署反饋的高信息密度樣本。
這也意味著,具身智能數(shù)據(jù)的難點(diǎn)從來(lái)不只是“采到”,而是“采到之后如何變得可用”。
同樣一段機(jī)器人執(zhí)行任務(wù)的原始記錄,如果存在時(shí)間戳漂移、傳感器不同步、空間標(biāo)定誤差,或者缺少動(dòng)作階段、任務(wù)語(yǔ)義和結(jié)果標(biāo)記,那么它對(duì)模型的訓(xùn)練價(jià)值就會(huì)迅速下降。更進(jìn)一步說(shuō),成功軌跡固然重要,但失敗樣本、糾偏過(guò)程和恢復(fù)動(dòng)作,往往更能決定模型在真實(shí)環(huán)境中的魯棒性和可部署性。
從這個(gè)角度看,具身智能行業(yè)真正缺的并不是原始數(shù)據(jù)本身,而是把原始數(shù)據(jù)穩(wěn)定轉(zhuǎn)化為訓(xùn)練輸入的能力。
這也是智域基石選擇切入的核心問(wèn)題。
03
做具身智能行業(yè)的“煉化層”
楊哲軒用過(guò)一個(gè)比喻來(lái)解釋這件事:如果說(shuō)原始數(shù)據(jù)像原油,那么真正稀缺的未必是誰(shuí)囤了更多“原油”,而是誰(shuí)能把不同場(chǎng)景、不同本體、不同質(zhì)量的數(shù)據(jù),穩(wěn)定煉化成模型可直接使用的訓(xùn)練輸入。
圍繞這個(gè)目標(biāo),智域基石設(shè)計(jì)了一套五段式的數(shù)據(jù)處理管線,包括質(zhì)檢、底座、編譯、檢索、交付五個(gè)環(huán)節(jié)。
第一層:質(zhì)檢
質(zhì)檢是原始數(shù)據(jù)進(jìn)入系統(tǒng)前的第一道關(guān)口。
在這一層,系統(tǒng)會(huì)對(duì)相機(jī)、IMU、關(guān)節(jié)狀態(tài)等多源傳感器數(shù)據(jù)進(jìn)行完整性與一致性檢查,識(shí)別丟幀、時(shí)鐘漂移、信號(hào)異常、校準(zhǔn)失效等問(wèn)題。對(duì)具身智能而言,這一步的重要性不言而喻:如果基礎(chǔ)數(shù)據(jù)本身存在錯(cuò)位,后續(xù)模型訓(xùn)練就很容易建立起錯(cuò)誤的感知—?jiǎng)幼饔成洹?/p>
第二層:底座
底座層主要解決的是多模態(tài)數(shù)據(jù)的時(shí)空對(duì)齊與統(tǒng)一組織問(wèn)題。
來(lái)自不同設(shè)備、不同采樣頻率、不同坐標(biāo)系的數(shù)據(jù),必須被映射到同一套數(shù)據(jù)底座上,才能支撐后續(xù)動(dòng)作切分、語(yǔ)義標(biāo)注和樣本構(gòu)建。對(duì)于機(jī)器人學(xué)習(xí)來(lái)說(shuō),這不是簡(jiǎn)單的數(shù)據(jù)存儲(chǔ)問(wèn)題,而是訓(xùn)練輸入能否成立的前提。
第三層:編譯
編譯層是整條鏈路的核心。
在這里,連續(xù)軌跡會(huì)被切分成可訓(xùn)練的樣本單元,并補(bǔ)充任務(wù)語(yǔ)義、動(dòng)作邊界、成功/失敗結(jié)果、接觸事件與關(guān)鍵狀態(tài)變化等信息。換句話說(shuō),原始記錄從這一層開(kāi)始,才逐漸從“物理過(guò)程”變成“模型可以學(xué)習(xí)的結(jié)構(gòu)化樣本”。
這也是“數(shù)據(jù)編譯”這一概念最關(guān)鍵的地方:它不是傳統(tǒng)意義上的數(shù)據(jù)清洗或標(biāo)注,而是把高熵、非結(jié)構(gòu)化、難復(fù)用的物理世界記錄,轉(zhuǎn)化成模型能夠反復(fù)調(diào)用和迭代的訓(xùn)練資產(chǎn)。
第四層:檢索
當(dāng)數(shù)據(jù)規(guī)模上來(lái)之后,問(wèn)題就不再是“有沒(méi)有數(shù)據(jù)”,而是“能不能快速找到對(duì)當(dāng)前任務(wù)真正有價(jià)值的數(shù)據(jù)”。
因此,檢索層面向的是海量數(shù)據(jù)資產(chǎn)管理。它圍繞場(chǎng)景、任務(wù)、對(duì)象、機(jī)器人類型、動(dòng)作階段、失敗模式等維度建立可查詢的數(shù)據(jù)索引體系,讓工程團(tuán)隊(duì)能夠更高效地完成樣本篩選、組合和調(diào)用。
第五層:交付
最終,數(shù)據(jù)還需要以標(biāo)準(zhǔn)化的方式進(jìn)入客戶訓(xùn)練和評(píng)測(cè)流程。
在這一層,數(shù)據(jù)集、元數(shù)據(jù)、版本信息以及配套說(shuō)明會(huì)被統(tǒng)一封裝,以便客戶直接接入訓(xùn)練、評(píng)測(cè)和回歸體系。這意味著,交付出去的不再是一堆原始文件,而是一套可直接被工程系統(tǒng)消費(fèi)的數(shù)據(jù)產(chǎn)品。
整體來(lái)看,這套管線的目標(biāo),是盡可能提升后端加工環(huán)節(jié)的自動(dòng)化程度,僅在真機(jī)采集和場(chǎng)景配置等前端環(huán)節(jié)保留必要人工參與,從而降低傳統(tǒng)人工處理模式在整體流程中的占比,并在成本、交付效率和標(biāo)準(zhǔn)化程度上形成工程化能力。
04
為什么更看To B,而不是家庭場(chǎng)景?
在“具身智能的 GPT-4 時(shí)刻”這個(gè)熱門話題上,楊哲軒的判斷相對(duì)克制。
他認(rèn)為,具身智能的關(guān)鍵拐點(diǎn)不會(huì)以某一天突然發(fā)生的方式到來(lái),而更可能是分階段出現(xiàn):先在少數(shù)高頻任務(wù)上形成穩(wěn)定能力,再逐步擴(kuò)展到更多場(chǎng)景和更多機(jī)器人平臺(tái)。
從這個(gè)邏輯出發(fā),智域基石當(dāng)前更看重的是To B場(chǎng)景。
原因并不復(fù)雜。家庭場(chǎng)景當(dāng)然擁有長(zhǎng)期想象空間,但在短期內(nèi),它仍然受制于成本、安全、可靠性和售后體系,真正愿意率先買單的用戶群體相對(duì)有限。相比之下,國(guó)內(nèi)制造、倉(cāng)儲(chǔ)、零售、醫(yī)療等 To B 場(chǎng)景任務(wù)密度更高、反饋鏈條更短,也更容易形成“采集—訓(xùn)練—部署—回流”的閉環(huán)。
這對(duì)一家做數(shù)據(jù)基礎(chǔ)設(shè)施的公司尤其重要。
因?yàn)閷?duì)具身智能來(lái)說(shuō),數(shù)據(jù)價(jià)值不是停留在采集端,而是取決于它能否在部署中繼續(xù)回流,并進(jìn)一步沉淀為可遷移、可復(fù)用的能力。也正因如此,智域基石判斷,具身能力大概率會(huì)先在工廠、倉(cāng)儲(chǔ)、醫(yī)院、門店等半結(jié)構(gòu)化 B 端場(chǎng)景中逐步落地。
當(dāng)然,這并不意味著 B 端數(shù)據(jù)天然就更容易處理。
恰恰相反,To B 場(chǎng)景的數(shù)據(jù)往往還伴隨著私有化部署、本地化合規(guī)、可追溯、系統(tǒng)穩(wěn)定性和結(jié)果復(fù)現(xiàn)性等要求。對(duì)數(shù)據(jù)公司來(lái)說(shuō),真正的挑戰(zhàn)不是把數(shù)據(jù)簡(jiǎn)單匯集起來(lái),而是在數(shù)據(jù)難以跨企業(yè)、跨場(chǎng)景自由流動(dòng)的前提下,如何把局部場(chǎng)景經(jīng)驗(yàn)沉淀為可遷移、可復(fù)用的模型能力。
05
產(chǎn)業(yè)方率先下注,
但公司要做的是開(kāi)放型基礎(chǔ)設(shè)施
商業(yè)化層面,智域基石目前處于很早期,但節(jié)奏并不慢。
據(jù)公司介紹,成立不到半年,其已形成近億元在手項(xiàng)目與合作儲(chǔ)備。客戶類型覆蓋機(jī)器人廠商、場(chǎng)景合作方及產(chǎn)業(yè)鏈伙伴,其中既包括與投資方之間的業(yè)務(wù)協(xié)同,也包括獨(dú)立的外部合作。
產(chǎn)業(yè)投資方的加入,確實(shí)能夠幫助一家新公司更早進(jìn)入真實(shí)場(chǎng)景、理解真實(shí)需求、驗(yàn)證真實(shí)流程;與此同時(shí),智域基石也對(duì)模型廠商、場(chǎng)景方保持足夠的開(kāi)放性和中立性。
從公司現(xiàn)階段的規(guī)劃看,智域基石也在朝這個(gè)方向推進(jìn)。
短期內(nèi),它仍會(huì)把重點(diǎn)放在數(shù)據(jù)采集、數(shù)據(jù)編譯和場(chǎng)景交付能力的打磨上;中期,則希望把前期沉淀下來(lái)的通用動(dòng)作、場(chǎng)景經(jīng)驗(yàn)和處理流程,抽象為可復(fù)用的數(shù)據(jù)產(chǎn)品和標(biāo)準(zhǔn)化工具鏈;更長(zhǎng)期看,公司希望沉淀出一套面向具身智能的數(shù)據(jù)底座,逐步升級(jí)為平臺(tái)型基礎(chǔ)設(shè)施,并圍繞接口、工具鏈和合作伙伴體系建立生態(tài)。
06
過(guò)去一段時(shí)間,具身智能行業(yè)的注意力更多集中在“大模型能不能泛化”“機(jī)器人本體能不能降本”這些更容易被討論的話題上。但越來(lái)越多從業(yè)者開(kāi)始意識(shí)到,決定行業(yè)節(jié)奏的,往往不只是模型本身,而是模型背后的那套數(shù)據(jù)供給和反饋體系。
在這個(gè)意義上,智域基石的價(jià)值,不在于它是不是一家“數(shù)據(jù)公司”,而在于它試圖解決的是具身智能最底層、也最工程化的一件事:如何讓物理世界中的原始記錄,穩(wěn)定轉(zhuǎn)化為模型能夠持續(xù)學(xué)習(xí)的訓(xùn)練輸入。
這件事不夠熱鬧,卻很可能足夠關(guān)鍵。
如果說(shuō)具身智能真正的分水嶺,不會(huì)只來(lái)自某一個(gè)模型版本的發(fā)布,而是來(lái)自整條“采集—編譯—訓(xùn)練—部署—回流”鏈路的成熟,那么數(shù)據(jù)基礎(chǔ)設(shè)施這條賽道,或許才剛剛開(kāi)始進(jìn)入價(jià)值顯現(xiàn)期。
未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!
公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.