![]()
![]()
6萬+分鐘數據、六大真實作業場景全覆蓋!
作者 |程茜
編輯 |漠影
機器人前瞻11月24日報道,近日,國內規模最大的全尺寸人形機器人數據集LET數據集正式發布,開源首批6w+分鐘真機數據,其還為開發者提供了一套數據轉換、模型訓練、仿真測試與真機部署的全流程數據工具鏈。

▲機器人真機實采與仿真數據
這一數據集是國內最大的面向真實作業場景的全尺寸人形機器人真機數據集,發布并開源首批6w+分鐘數據,由樂聚機器人、國家地方共建人形機器人創新中心、北京數聚通啟、吳江智訓未來聯合主導構建。
目前,其6萬多分鐘數據已被捐獻至開放原子開源基金會,在Openloong開源社區官網上線。
數據采集是人形機器人從實驗室走向規模化應用的核心前提,其數據質量與有效性直接決定了機器人具身智能的智能化水平上限。但目前這一領域仍面臨諸多現實瓶頸,如數據采集難度高、數據價值挖掘不充分、行業標準化缺失等問題尤為突出。
此次LET數據集的開源,不僅為行業提供了高質量數據解決方案,更構建了全流程技術支撐體系,加速人形機器人技術落地進程。
01.
統一真機實采
可應對復雜多場景需求
數據獲取難度大、標注流程復雜等問題已成為人形機器人研發的核心瓶頸,再加上可用的高質量數據稀缺,也直接制約了其模型訓練效果與跨場景泛化能力的提升。
業界主流的數據采集方式涵蓋仿真生成、數據合成與真機實采等,其中真機實采因能獲取真實場景下的高保真多模態數據,是突破仿真和現實之間“域差”、確保模型訓練質量與泛化能力的最有效方式。
真機實采的優勢在于,其數據直接源自真實環境中的物理交互,能精準還原力覺反饋、環境干擾等仿真數據難以模擬的細節,還能同步采集視覺、視覺、運動、語音等多維度數據。如下面LET數據集中的物流場景,機器人可還原拿取、掃描、放置快遞全流程。

▲機器人真機實采與仿真數據
LET數據集正是當下國內開源領域規模最大全尺寸人形機器人數據集,其完全基于真機實采。
LET數據集是基于樂聚夸父系列全尺寸人形機器人進行統一采集。這一人形機器人具備40多個自由度,身高約1.66米、體重約55公斤,同時搭配頭部立體相機與腕部RGB-D相機,可有效避免因機器人形態差異導致的數據偏差問題。
一方面,這一人形機器人的形態參數貼合實際應用需求,另一方面,相機的協同感知能提升數據采集精度。如下面對日用品的擺放,其可以通過頭部和腕部相機協同,將物品放置到正確位置。

除了技術層面,人形機器人產業發展仍面臨一大核心短板,那就是相關國家標準的缺位,技術路線碎片化、資源浪費等都會為未來人形機器人規模化量產造成風險。
因此,LET數據集從一開始就做到了標準化。
該數據集以國家地方共建人形機器人創新中心規范為基準,從源頭確保數據的高質量、專業合規性與可用性,通過統一流程與標準化處理,破解數據多源異構、數據格式不一、質量參差不齊等痛點,實現規模化、高質量的數據生產。
據了解,樂聚機器人與國家地方共建人形機器人創新中心還在聯合開展國家及行業標準研制,推動國家級標準化試點標準驗證與實施應用,從根源上破解數據采集標準化難題。
綜上可以看出,以真機采集為核心數據來源,并且建立在統一基準之上的LET數據集,或成為推動具身智能高質量訓練與規模化落地的關鍵之一。
02.
多模態數據+六大真實作業場景
精準匹配數據需求痛點
結合當前人形機器人從實驗室走向多場景落地、行業亟需真實場景高質量數據破解域差與泛化難題的背景,當我們聚焦于其數據本身會發現,LET數據集正以多模態數據深度融合與六大貼合工業、服務等實際需求的真實作業場景為支撐,精準匹配行業數據需求痛點。
首先在多模態數據方面,人形機器人往往需要模擬人類的感知、決策、執行的類人化交互邏輯,而單一模態數據無法覆蓋真實場景中復雜的環境認知與物理交互需求,因此需要多模態數據的協同。
LET數據集融合了機器人頭部和雙腕視角的清晰、穩定視頻流,并同步采集RGB圖像、深度圖、關節狀態及末端執行器狀態等關鍵模態信息,全方位捕捉人形機器人的操作細節,使得最后的數據有較高完整度。
為了進一步提高數據質量,該數據集還采用了一套系統的多模態對齊標注體系,通過任務標注細化與多維度語義標簽,使得機器人能更精準地學習類人化交互邏輯。
![]()
其次在真實場景方面,人形機器人最終需要在多樣化真實環境中實現實用化落地,因此需要不同場景的真實作業數據,以讓機器人模型學習適配不同環境特征、任務邏輯與突發情況。
LET數據集涵蓋了工業、商業零售及日常生活3大領域中,汽車工廠、快消場景、3C工廠、酒店服務、生活服務及物流場景6大場景,以及涵蓋抓取放置、工具使用、搬運、協作等典型任務,覆蓋移動平臺、機械臂單臂抓取,多臂協作等多種操作形態的31項任務、117種原子技能。
如在日化生產場景,其數據案例就包括日化產品的定姿擺放:

在汽車制造場景,應用案例會涉及SPS零件分揀:

在物流場景,LET數據集會包含快遞分揀的應用:

在3C場景,其有傳送帶物料分揀應用:

該數據集目前汽車工廠的占比較大,這也契合當下人形機器人率先在汽車工廠落地的行業趨勢。
![]()
可以看出,這一數據集的場景基本覆蓋了當下人形機器人的應用場景,且圍繞率先規模化落地的具體場景完成定向優化。其既能夠為機器人算法提供多樣化真實場景的實戰數據支撐,還可以提升泛化能力,為機器人之后學習復雜技能鋪路。
多模態數據融合與多場景真實作業,這樣的雙重優勢疊加,既可以解決高質量數據稀缺的行業痛點,又通過精準感知、場景適配的組合,降低企業研發階段的樣本采集與模型調優成本。
03.
以硬件、算法、流程組合方案
突破數據采集瓶頸
要實現這樣的全棧式數據集構建,首要攻克的便是數據實采環節的技術壁壘。對于人形機器人數據實采而言,真實環境的不可預測性與硬件部署、流程銜接的協同復雜性,是繞不開的核心挑戰。
在此基礎上,LET數據集通過數采鏈路實現了三大技術創新。
一是構建視覺伺服閉環數據。一般而言機器人本體與傳感器存在固有制造誤差、校準偏差,且不同設備的硬件參數存在異構性,其將有誤差的機器人本體和傳感器,轉變為依賴一個統一的、抽象的坐標系或特征,可有效解決多設備數據一致性難題,使數據質量一致性達到90%以上。
如下面復雜場景中,機器人可以準確拿取物品,并通過轉身、走路等運動將其放置到固定位置。

二是采用高效的組幀技術。傳感器數據傳輸、處理過程中的延遲會導致多源數據時序脫節,使得模型無法學習到精準的動作時序控制規律。其將多傳感器數據幀的時間戳誤差與延遲嚴格控制在10ms以內,顯著提升數據層時序同步的準確性。
三是建立自動化Benchmark評測體系。數據集缺乏對數據收斂度的系統性評估時,采集數據與目標應用場景的適配性可能無法量化,因此其對數據收斂度、樣本效率與穩定性進行全面評估,可確保數據遷移的有效性和泛化能力。
這種通過硬件校準、算法優化、流程標準化的組合方案正是其系統性提升數據質量、對齊精度與模型可驗證性的關鍵。
04.
結語:為人形機器人研發注入數據動力
人形機器人實采需要面對高成本、低效率、規模化與數據質量難以兼顧的現實制約,而其核心意義在于能夠突破仿真數據與現實世界的域差瓶頸,獲取高保真、強適配的真實場景多模態數據,為機器人具身智能模型提供貼近實際應用的訓練樣本。
此次由樂聚機器人主導開源的國內規模最大真機實采數據集,可以進一步提升機器人動作精度、環境適應能力與跨場景泛化能力,最終破解行業落地適配難題,加速人形機器人從實驗室研發走向規模化商業應用的進程。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.