<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      賽迪前瞻:我國具身智能數據集工程化落地亟待破解四大瓶頸

      0
      分享至


      具身智能包括本體、數據集、模型、場景四大組成要素,其中,數據集關系到具身智能的智能涌現和能力泛化。當前,在數據集領域,國家級數據訓練場、行業級開源社區與企業級數據開發平臺協同發力,形成了“真機遙操+靈巧手采集+仿真數據”三層數據供給體系,支撐視覺-語言-動作(VLA)模型與世界模型并進式發展。但具身智能數據集供給仍呈現點狀分散格局,受限于標注工具不足、采集成本高昂、多模態技術滯后與標準體系缺失等瓶頸,掣肘了具身智能從技術驗證向規模化商業應用的進程。亟需培育高質量具身智能數據訓練場,打造數據集標注平臺,建設數據集開源社區,研制數據集標準規范,開展規模化場景應用示范,探索具身智能數據集產業高質量發展的“中國路徑”。

      一、我國具身智能數據集的建設現狀

      從建設主體看,國家級數據訓練場、行業級開源社區與企業級數據開發平臺協同發力,具身智能數據集開發生態縱深性發展。一是國家級訓練場構建“2+N”數據生產體系。國家層面,已在北京和上海建成2個國家級具身智能訓練場。其中,北京國家地方共建具身智能機器人創新中心已建成近萬平米的中試驗證工廠,年產能達數千臺套,配備近百套關鍵測試儀器,支持整機、一體化關節、機械臂等全鏈條測試驗證。上海國家地方共建人形機器人創新中心訓練場已部署102臺異構人形機器人,具備每日生成5萬條數據的能力。地方層面,河南、江蘇、北京、深圳等省市正積極推進人形機器人創新中心分訓練場建設。其中河南分訓練場聚焦12大傳統產業,部署近百臺機器人,覆蓋20多個真實場景。二是行業級開源社區推動關鍵資源共建共享。地方、企業及科研機構主動開放資源,以共建方式降低行業創新門檻。如傅利葉智能開源了包含3萬條真機數據的ActionNet數據集及配套工具鏈,地瓜機器人等也積極打造開發者社區。北京國家地方共建具身智能機器人創新中心上線了開源社區,提供具身天工機器人本體、慧思開物SDK、RoboMIND數據集及訓練工具鏈等資源。三是機器人本體企業和技術服務平臺企業推動企業級數據研發和服務。機器人本體企業基于自有硬件進行真機數據的采集積累,如智元機器人AgiBot World真機數據集、宇樹科技G1機器人操作數據集、帕西OmniSharing DB全模態具身智能數據集。技術服務平臺企業則提供數據采集平臺、仿真工具、數據標注服務等數據服務,助力企業數據集開發。如群核科技提供虛擬數字道場平臺SpatialVerse,通過生成可交互的三維合成數據,支持機器人進行避障、抓取及緊急制動等任務的仿真訓練;智源研究院則打造高保真仿真框架AgiBot Digital World,為機器人設計提供仿真數據生成解決方案。

      從技術路徑看,形成了數據供給“真機遙操+靈巧手采集+仿真數據”三層體系,規模化采集能力初步建成。一是真機遙操。智元機器人、傅利葉智能等企業,通過覆蓋單臂、多臂、人形、四足等多形態機器人,可在家居、餐飲、工業、辦公等200多個真實場景中執行復雜操作,積累大量真實交互數據。二是靈巧手采集,通過觸覺傳感器精準記錄人手精細動作,為精密裝配、柔性物體操控等任務提供關鍵數據。靈巧智能DexCanvas數據集,匯聚了22類人手操作模式、超1000小時真人多模態演示數據,驅動五指靈巧操作模型。三是仿真數據。銀河通用、光輪智能、深信科創、云道智造等企業,借助物理引擎和圖形學構建虛擬環境,可低成本生成大規模數據。

      從建設成效看,具身智能數據集支撐VLA與世界模型發展,涌現一批典型模型。一是在VLA模型方向,大規模、多模態數據集為其提供了訓練基礎,使機器人能夠融合視覺感知、語言理解與動作控制,高效執行復雜任務。比如銀河通用機器人依托具身大模型GraspVLA,通過十億幀數據訓練,掌握機器人泛化閉環抓取能力。星動紀元發布VLA模型ERA-42驅動的雙足機器人,學習人類操作視頻和真機數據,可實現4m/s疾速奔跑、360°旋轉跳及工業級精細作業。二是在世界模型方向,機器人通過海量視頻數據,學習環境中物體與事件的演變規律,提升其對未來狀態的預測與因果推理能力。如智元機器人的Genie Envisioner世界模型平臺,基于3000小時的真機操控視頻數據,賦能機器人實現“制作三明治”“倒茶”“擦拭桌面”等任務。宇樹科技基于5個涵 蓋 機 械 臂 和 人 形 機 器 人 的 任 務 數 據 集 , 搭 建UnifoLM-WMA-0世界模型架構。三是技術架構正從分層架構向端到端演進,VLA與世界模型或將融合。當前具身智能仍以分層架構為主,隨著仿真與真實數據的進一步融合,“世界模型為大腦、VLA為手眼”的融合架構將成為新趨勢。

      二、具身智能數據集工程化落地存在四大瓶頸

      當前,我國具身智能數據集建設已形成多主體協同、多層次供給的格局,但仍呈點狀分散狀態。要實現具身智能領域的技術迭代與規模化商業落地,必須加快推進數據集工程化落地——即構建覆蓋數據采集、標注、應用、評估全流程的標準化和產品化,實現數據集的高效生產與可靠復用,為具身智能模型訓練與場景適配提供系統化支撐。目前,該進程仍面臨四大瓶頸制約。

      (一)數據標注工具制約高質量數據集構建

      一是具身智能標注工具仍顯匱乏。VLA模型要求對視覺場景、語言指令及動作軌跡進行時空關聯標注,世界模型更需要標注視頻序列中的物理屬性、物體狀態變化及潛在的因果聯系。然而,現有工具多側重于靜態圖像或簡單視頻標注,難以高效支持VLA模型和世界模型對長序列、3D空間和物理動態標注的需求,數據標注精度不足。二是缺乏數據標注全生命周期平臺。標注規范、工具接口和數據格式各異,使得不同企業的標注數據復用性與集成性較差,制約了數據生態的協同效率。

      (二)數據采集成本限制數據集規模化擴張

      一是軟硬件投入高。與傳統AI數據集采集相比,構建覆蓋多任務、多環境的具身智能真實數據集需投入大量機器人、傳感器及專業標注工具,成本高昂,單臺設備產生一萬小時訓練數據需要消耗上百萬元。二是人員成本高。一個數采員一天只能采集300-500條數據,如果是復雜任務,數據采集產出會更低。

      (三)多模態融合技術影響數據集有效性

      一是仿真數據的遷移可靠性不足。由于物理引擎難以完全模擬復雜的真實力學特性,如接觸、摩擦、材料變形,導致依托仿真數據訓練的策略模型遷移到真實環境時出現顯著性能衰減。例如依托仿真數據LIBERO-LONG訓練的世界模型在辦公桌面的現實環境中失效。二是多模態數據精準融合困難。視覺和觸覺數據的精度需求存在跨量級鴻溝,精準對齊和標注仍是行業難題,制約人形機器人作業的精確性和適應性。盡管戴盟、帕西尼、疊動等企業在傳感器與算法層面已取得突破,但高精度的視觸覺融合技術仍有待攻克。

      (四)數據標準缺失阻礙數據集共享與復用

      一是開源數據標準化程度不高。不同機構的開源數據集在數據格式、標注體系、傳感器參數與任務定義等方面存在顯著差異,缺乏統一的本體描述與接口規范,導致數據難以跨項目集成與復用。此外,數據采集設備、環境配置與操作協議不統一,也使得多源數據難以有效對齊與合并。二是具身智能數據標準體系有待完善。目前國家和地方層面發布或正在起草的標準多集中于數據生產環節,對數據質量評估、數據集泛化性能評測等,仍需更完善的標準制定和平臺支持。

      三、對策建議

      (一)加強載體建設,培育高質量數據訓練場

      一是支持國家級具身智能數據訓練場聚焦行業發展的前瞻性、基礎性問題,攻克共性技術難題、制定數據標準、建設普惠性基礎設施。二是鼓勵有條件的地方立足自身產業優勢,通過設立專項、配套政策與資金,建設一批聚焦工業裝配、家庭服務等細分領域的具身智能數據訓練場,構建特色化、差異化的具身智能數據體系。

      (二)突破關鍵技術,打造數據集標注平臺

      一是強化軟硬件協同,系統發展具身智能多模態傳感器、仿真建模、數字孿生等關鍵技術,深度適配VLA模型和世界模型發展。二是突破數據處理的核心算法,加強多模態數據融合、仿真-真實數據遷移、數據合成與增強等核心技術攻關,為高效、高精度數據標注提供核心驅動力。三是鼓勵標注企業與機器人企業共建具身智能多模態數據集標注平臺,加強核心算法研發,推動標注工具智能化,形成可復用、可推廣的行業級解決方案。

      (三)注重開源開放,建設數據集開源社區

      一是建設具身智能開源社區,推動基礎模型、訓練數據、工具鏈、操作系統、仿真環境等技術開源,推動構建萬億級多模態開源數據庫。二是支持高校、龍頭企業與開源社區共建課程與實踐平臺,通過舉辦具身智能算法競賽、設立開源貢獻獎勵等方式,培育一批既懂技術又具開源精神的復合型人才,激發產業創新活力。

      (四)加快標準制定,研制數據集標準規范

      一是加強標準統籌。堅持“統籌部署、軟硬協同、急用先上、開源先行”的原則,加快推進具身智能分行業、分場景數據集標準體系制定,積極推動開源數據集標準化。二是突出核心任務。面向物體抓取、自主導航、復雜指令遵循等核心任務,支持行業建設具身智能數據集測試標準體系。三是開展評測認證。鼓勵第三方機構建立數據集質量評測與認證體系,推動標準在典型場景中先行試用與迭代優化,為數據流通與應用建立基礎信任。

      (五)深化行業應用,開展規模化場景應用示范

      一是聚焦工業制造、商業零售、醫療康養、家政服務等重點領域,開展場景征集與任務揭榜,探索具身智能應用新業態。二是組織開展具身智能數據集典型案例遴選,支持行業企業打造可推廣可復制的示范應用標桿,推動具身智能規模化商用落地。

      來源 | 賽迪智庫

      編輯 | 辦公室


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      林志穎長子Kimi正臉曝光,17歲Kimi竟然長成了陳若儀翻版!

      林志穎長子Kimi正臉曝光,17歲Kimi竟然長成了陳若儀翻版!

      娛樂順風車666
      2026-04-13 11:34:58
      華工科技:預計2026年第一季度凈利潤為6億元~6.4億元,同比增長46.38%~56.13%

      華工科技:預計2026年第一季度凈利潤為6億元~6.4億元,同比增長46.38%~56.13%

      每日經濟新聞
      2026-04-13 16:24:21
      高盛:未來3年,上海、深圳房價上漲15%

      高盛:未來3年,上海、深圳房價上漲15%

      地產觀點
      2026-04-13 14:00:06
      美國洛馬怎么也沒想到,沒繳中國的990億罰單,后果竟如此嚴重了

      美國洛馬怎么也沒想到,沒繳中國的990億罰單,后果竟如此嚴重了

      有范又有料
      2026-04-13 15:53:13
      鄭麗文返臺,“三駕馬車”親自迎接、釋放2大信號!1人現身不簡單

      鄭麗文返臺,“三駕馬車”親自迎接、釋放2大信號!1人現身不簡單

      時尚的弄潮
      2026-04-13 12:11:58
      今明兩天!北京大范圍降雨!

      今明兩天!北京大范圍降雨!

      美麗大北京
      2026-04-13 19:03:54
      真膈應啊!一老人走了,鄰居發帖稱家門被貼了塊紅布,又懵又火大

      真膈應啊!一老人走了,鄰居發帖稱家門被貼了塊紅布,又懵又火大

      火山詩話
      2026-04-13 10:40:34
      德國站隊了!正式向世界宣布:以色列若繼續打黎巴嫩,會讓他好看

      德國站隊了!正式向世界宣布:以色列若繼續打黎巴嫩,會讓他好看

      Ck的蜜糖
      2026-04-13 17:50:08
      解放軍這40天,要把美日韓逼瘋!

      解放軍這40天,要把美日韓逼瘋!

      Ck的蜜糖
      2026-04-13 07:27:43
      莫妮卡·貝魯奇:歲月不敗的“地球球花”,黑裙封神

      莫妮卡·貝魯奇:歲月不敗的“地球球花”,黑裙封神

      述家娛記
      2026-04-11 13:36:04
      富得流油,法國國家隊三套鋒線組合總身價8.55億歐元

      富得流油,法國國家隊三套鋒線組合總身價8.55億歐元

      懂球帝
      2026-04-13 18:45:06
      知名國企集團,六個月沒發工資了

      知名國企集團,六個月沒發工資了

      新浪財經
      2026-04-13 04:16:19
      西方國家為什么都不喜歡中國?英國專家:中國有一個“老問題”

      西方國家為什么都不喜歡中國?英國專家:中國有一個“老問題”

      甜到你心坎
      2026-04-12 22:42:27
      主持人魏笑的最后3天:15號生日,16號領證,17號婚禮成葬禮

      主持人魏笑的最后3天:15號生日,16號領證,17號婚禮成葬禮

      就一點
      2026-03-19 10:47:51
      蘋果贏麻了!iPhone17國內銷量突破2700萬臺,是Mate80的五倍不止

      蘋果贏麻了!iPhone17國內銷量突破2700萬臺,是Mate80的五倍不止

      互聯魚
      2026-04-12 18:13:54
      以色列誰都敢打,為何唯獨不敢動巴基斯坦?核武只是冰山一角

      以色列誰都敢打,為何唯獨不敢動巴基斯坦?核武只是冰山一角

      泠泠說史
      2026-04-11 23:48:34
      孕婦吃水果被罵后續:手術已做完,聽勸解救了自己,全網力挺點贊

      孕婦吃水果被罵后續:手術已做完,聽勸解救了自己,全網力挺點贊

      千言娛樂記
      2026-04-13 11:33:13
      13歲男孩騎車被繩子割喉,忍痛跑回家求救!警方已介入

      13歲男孩騎車被繩子割喉,忍痛跑回家求救!警方已介入

      上觀新聞
      2026-04-13 17:52:16
      萬惡的舊社會?15張1944年照片,這就是真實的“舊社會”

      萬惡的舊社會?15張1944年照片,這就是真實的“舊社會”

      棠棣分享
      2026-04-11 22:53:08
      不知悔改!47歲女作家拒道歉+繼續侮辱全紅嬋:縱容隊友被霸凌

      不知悔改!47歲女作家拒道歉+繼續侮辱全紅嬋:縱容隊友被霸凌

      念洲
      2026-04-13 08:50:12
      2026-04-13 20:48:49
      中國電子信息產業發展研究院 incentive-icons
      中國電子信息產業發展研究院
      工信部直屬的科研事業單位
      2969文章數 912關注度
      往期回顧 全部

      科技要聞

      "抄作業"近四年,馬斯克版微信周五上線

      頭條要聞

      媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關系

      頭條要聞

      媒體:歐爾班敗選不僅是一國之事 牽扯到與中國的關系

      體育要聞

      一支球隊不夠爛,也是一種悲哀

      娛樂要聞

      初代“跑男團”合體,鄧超、鹿晗缺席

      財經要聞

      今夜,出大事了,3種結果

      汽車要聞

      不止命名更純粹 領克10/10+要做純電操控新王

      態度原創

      健康
      藝術
      房產
      教育
      數碼

      干細胞抗衰4大誤區,90%的人都中招

      藝術要聞

      22位中國當代名家油畫作品

      房產要聞

      6000億投資盛宴,全球巨頭齊聚,海南又要干件大事!

      教育要聞

      燕子飛時 | 麥田團隊動態20260413期

      數碼要聞

      前行者推32kHz回報率磁軸鍵盤ES68破曉,預售到手低至699元

      無障礙瀏覽 進入關懷版