在風險投資圈里,有個經典的投資人提問叫做“護城河”。
這個詞是巴菲特帶火的。老爺子說,那些帶來豐厚投資回報的企業,普遍都擁有足夠寬、足夠深的護城河,確保了競爭對手無法在短期內搶走他們的業務,也讓對手與他們的競爭變成了一場非常不劃算的“消耗戰”,進而幫助他們盡可能地遠離市場波動,專注地投入到業務上——于是在老爺子巨大的“財富效應”照耀下,每個風險投資人都開始習慣性地在聊項目的時候,問一句“你們的護城河”是什么?
移動互聯網時代的創業者會說,護城河是他們無敵的“地推鐵軍”。電商時代的創業者說,護城河是他們極致的“供應鏈管理”。新消費時代的創業者可能說,護城河是他們敏銳的市場洞察。
而對于人工智能時代的創業者來說,這個問題的最佳答案,大概率將是“數據”。
雖然人們一聊起人工智能創業,就本能地想到“算力”和“電力”,還編出了一句順口溜叫“人工智能的盡頭是算力,算力的盡頭是能源”。但歸根結底,無論是算力還是電力都是為“最終結果”服務的,而決定人工智能“最終結果”的正是“數據”。硅谷最頂級的AI投資人之一、A16z創始人馬克·安德森就在他的個人播客里非常直白地指出,AI時代真正的創業瓶頸并不是“算力”,而是“訓練數據”,因為數據不僅是“有限的”,還是有“所有權的”。
他們還統計到了這樣一組數據,在2023年4月至2024年4月期間,由于網站嚴厲打擊將其文本、圖像和視頻用于人工智能訓練,所有數據中有5%是無法被創業者們抓取的——如果僅統計“真正有訓練價值的數據”,那么這部分無法被抓取的數據占到了整體的25%。
有傳聞稱,就連人工智能的頭部企業OpenAI也備受“數據困擾”,甚至不得不采取了這樣的“笨辦法”:他們設立了一個名為“人類數據團隊”的部門,聘請數千名程序員、醫生、律師,讓他們親手撰寫問題的答案,以便訓練人工智能。
可以說,誰有辦法在技術層面有效地解決“數據”問題,誰就真正找到了人工智能創業的金鑰匙。也正是在這樣的前提下,一支來自深圳的青年創業團隊脫穎而出:
據投中網獲悉,視頻具身數采企業樞途科技(SynaData)于近日正式完成天使+輪融資,距離由東方富海及兼固資本領投的天使輪融資時隔僅僅兩個月。本輪由辰韜資本獨家投資,深藍資本擔任長期獨家財務顧問,融資資金將主要用于SynaData數據管線的進一步提升和工程化、大規模數據集的生產和交付、以及人才團隊的持續擴充。
尋找數據集,難在哪里?
正如上文所說,雖然肉眼可見的是近幾年來人工智能模型能力越來越強、AI Agent應用領域越來越廣泛、具身智能動作越來越復雜,但主流的數據生產方式,卻依舊停留在“人類手把手示范”的時代。如今全國各地遍地開花的具身智能訓練中心就是一個非常具體的場景——在正式投入使用之前,需要大量工作人員用牽引遙控的方式,幫助機器人在特定的使用場景內不斷重復指定動作,以此來積累足夠的數據。
而痛點即市場空間。近年來,人工智能領域里也涌現了大量的“數據集供應商”,其中不乏明星公司。比如被Meta以300億美元估值收購的Scale AI,定位就是人工智能數據標注和標記服務。此外,像Snowflake、Databricks這些傳統數據庫供應商也在近幾年完成了轉型,本著“近水樓臺先得月”的優勢推出了經過清洗、結構化、經過預處理的即用型數據集,進而吃盡了人工智能的增長紅利——據最新的報道顯示,Databricks已經啟動了最新一輪融資,估值達到了1340億美元(約合人民幣9466.3億元),相較于去年年底的上一輪融資直接翻倍。
但問題在于,目前這些數據供應商們所采取的技術路線,均存在著自身難以解決的難點。
例如Scale AI采用的人機協作采集和標記路線雖然門檻低、起步快,但隨著產品應用得更加廣泛,再加上抓取的內容需要進行大量的清理、去重和規范化才能使用,這種技術路線對應的成本將幾何倍增加,對大型數據集需求的擴展性有著明顯的天花板。而Snowflake、Databricks這些專業數據供應商雖然能保證數據質量與合規問題,但數據更新的及時性以及核心數據的完整性都大打折扣。
![]()
上圖來自A16z,研究樣本是“AI客服”。A16z分析師指出,在現有的數據采集技術路線下,訓練AI客服的時候,最開始的投入還是具備“性價比”的,能夠做到“一分耕耘一分收獲”——20%的成本投入能覆蓋約20%的客戶用例。但在跨越20%之后,每多覆蓋一個用例,所需的數據收集和清理成本會急劇上升,最終在覆蓋40%客戶用例的水平上出現停滯,很難出現提升。
再回到上文我們提到的“具身智能訓練中心”案例。“人工訓練”雖然看起來很“原始”,但對于尚處發展初期的、不得不兼顧成本與發展需要的具身智能企業們來說,并沒有太多選擇。以至于具身智能的創業者們逐漸進入了另一種困境:
一方面,行業在訓練中心上的投入規模越來越大、訓練中心的數量越來越多;另一方面由于各本體形態、結構差異巨大,通過自建訓練中心采到的數據往往只能用于自家訓練,無法跨廠商復用,形成大量“數據孤島”。
如果用細分領域內最大的數據集進行橫向對比,瓶頸更加一目了然:
? 文本:15T Tokens
? 圖像:6B Image-Text Pairs
? 視頻:2.6B Audio/Visual Features
? 具身智能:僅2.4M Episodes
也就是說,沒有規模化、可泛化、可遷移的高質量數據,是人工智能應用目前最大的瓶頸,而具身模型則是人工智能細分賽道中,受到這個瓶頸制約最嚴重的那一個,也與具身智能今年以來熱鬧的融資節奏形成了一個非常“刺眼”的反差。
像人類一樣,學會“看”
那么樞途科技提出的解決方案是什么呢?
樞途科技成立于2024年,公司成員平均年齡不到28歲,核心研發成員來自于清華大學、上海交通大學、美國佐治亞理工、卡內基梅隆大學、斯坦福大學、香港科技大學等海內外頂尖高校實驗室,對具身智能數據采集及處理、具身智能模型架構設計有深入的探索和顛覆式的思考;
他們的共識是,在所有AI技術浪潮里,真正的拐點從來不是“功能變強”,而是“學習方式改變”——從監督學習到自監督學習,從大規模文本到通用多模態語料,正是每一次學習方式的迭代帶來了成本結構被改寫、能力邊界被重新定義。
而人類作為目前已知學習能力最強的生物,人類對于動作、技能的習得并不是依靠別人手把手教會我們每一個動作,而是通過觀察大量行為,自然習得動作背后的規律。因此他們認為,如果要真正有效地解決具身智能現在面臨的困境,那么就要想辦法幫助機器人用更高效的方式理解物理世界的行為和動作;要找到一種媒介將物理世界行為轉化為虛擬世界數據,讓機器人有能力從這些數據中習得物理世界的常識與行為模式,這個媒介就是“視頻數據”。
當然“視頻數據”并不是一個全新的技術概念。時間回到今年5月,特斯拉工程主管米蘭·科瓦奇(Milan Kovac)通過X平臺宣布,Optimus將正式告別傳統的動作捕捉和遠程操控訓練方式,全面轉向基于視頻數據的“純視覺”AI訓練模式。他強調:“我們的目標之一是讓Optimus直接從人類執行任務的互聯網視頻中學習。這些視頻通常是隨機攝像頭捕捉到的第三人稱視角。”
此外,國外的Skild AI提出了利用視頻數據解決數據瓶頸的方法;國內的逐際動力、千尋智能、BeingBeyond都提出采用視頻數據來提升機器人的智能水平,具身智能產業正在迅速達成一個共識,即傳統依賴遙操作和動捕技術的數據采集路徑,因其高成本和難以規模化的特性,已成為制約具身智能發展的關鍵瓶頸。
樞途的差異化在于,他們構建了一套名為SynaData的自動化數據管線,將海量真實世界視頻轉化為適用于具身智能的通用訓練數據,讓模型能夠從中提取動作邏輯、空間模式和行為線索——并最終遷移到不同的機器人形態與任務場景中。
技術上,從普通的人-物交互2D視頻中提取模型訓練所需的“具身數據”,最重要的一步是對視頻進行高精度的升維重建,SynaData通過結合海量先驗知識庫與多模態融合算法,將視頻中缺失的深度信息、空間結構與物體形態精準還原,提取高精度的人體骨架三維連續動作序列、物體平移旋轉軌跡、物體mesh等關鍵數據模態,并將收集到的人物交互數據以通用的標準化形式存儲,成為能夠賦能全行業不同玩家的Raw Data。
重建精度是決定數據價值的絕對核心:當機器人執行交互動作時,操作誤差往往決定了任務成敗。SynaData已將視頻重建誤差從傳統方法普遍存在的±5cm降低至±5mm,實現了數量級的精度突破。毫米級的重建能力,使得視頻數據真正具備了“可被機器人直接學習”的質量標準,也讓數據從“不可控樣本”變成“可擴展生產要素”,推動行業進入數據自主生成和復用的新階段。
視頻數據在被升維后,仍需解決“能否遷移到不同本體上訓練”的關鍵問題。具身智能領域長期存在的挑戰,是缺乏一種可靠的跨域Retargeting能力,能夠把“人類動作點”與“機械臂/人形機器人結構”進行逐點映射,使其在動力學差異和結構差異下仍能穩定執行動作。
SynaData通過動態結構適配算法,將human-to-humanoid的模仿學習誤差降低超過50%,任務成功率提升40%。這一能力讓不同機器人可以共享同一數據源,也讓“數據跨本體復用”成為現實,從根本上打破了數據孤島。
在實際驗證中,樞途SynaData已經跑通RDT、π0.5、智元Go-1、Diffusion Policy、ACT等主流開源VLA具身模型,是業內唯一完成多家第三方模型端到端驗證的數據公司,并已在多家頭部具身獨角獸公司完成數據驗證,商業化閉環全面跑通。
更具想象空間的是,SynaData的數據管線不僅能夠提取標準幾何與軌跡信息,更能利用現實世界中更豐富的模態,將模型從“模態不足”的限制中解放出來,使下一代具身模型能夠成長出更豐富、更強大的抽象與理解能力。
樞途也正是基于這樣的能力,自成立以后很快就得到了資本市場以及產業方的廣泛關注:
2024年12月,樞途科技拿到了自成立以來的第一筆融資,投資方為奇績創壇創始人陸奇博士;
2025年8月,英偉達在其官方公眾號“NVIDIA英偉達中國”中,將SynaData視為“NVIDIA全棧技術加速樞途科技構建具身訓練數據新范式”,認為其實現了2D視頻到3D數據的高速重建,以及3D數據至具身多模態訓練數據的高速提取,并將所提取的具身多模態訓練數據與 Isaac Sim平臺進行了融合,實現了從視頻3D重建、軌跡等多模態數據提取、仿真環境融合、VLA模型訓練的全棧批量化視頻數據具身模型訓練閉環;
2025年9月,樞途科技獲得了2025高通創投-紅杉中國創業大賽冠軍。隨后,樞途科技公布了規模為數千萬元人民幣的天使輪融資,由東方富海及兼固資本聯合領投。
從“資源”變為“基礎設施”
從楊立昆、李飛飛們近段時間大談的“世界模型”,再到特斯拉、樞途科技發力的“視頻數據”,我們可以看到在人工智能的發展曲線上,數據不再只是支撐模型的輔助資源,而逐漸成為能否規模化、能否落地、能否持續進化的關鍵基建。
尤其是對于具身智能而言,作為人工智能最具象化的承載,也是人類下一階段無可爭議的發展方向,其對數據的要求遠高于其他模態:場景更復雜、交互更多樣、動作更連續、物理規律更細膩。因此,誰能率先建立可擴展的數據體系,誰就掌握了行業的供給側入口。
這些前提決定了樞途科技的涌現是一個開始:2025年勢如潮水的創業潮、融資潮代表的更多是“未來增長的共識”,而并非“產業發展程度”的肯定——人工智能以及具身智能想要成為一個完整的、正向循環的、有通暢產品開發路線的產業,就需要不依賴單一本體、不受限于單一場景,站在產業鏈上游的大量“基礎設施”建設者們。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.