![]()
工業和信息化部近日批準發布《YD/T 6770—2026 人工智能 關鍵基礎技術 具身智能基準測試方法》,為具身智能領域首份行業標準,將于6月1日正式實施,標志著具身智能評測邁入“有標可依”的新階段。
該標準為具身智能領域構建了統一基準測試框架,規范了在仿真環境和真實環境下,開展具身智能基準測試的環境設置、任務庫構建、測試過程和指標計算方法。目前該標準已同步推進國際標準立項。
中國信通院有關專家表示,可信的評測體系是連接技術研究與大規模產業應用的橋梁和標尺,該標準將為行業提供統一的技術規范框架、建立互信基礎。在技術研發層面,為具身智能的能力評估提供統一的度量依據,指引技術迭代方向,幫助行業及早識別并收斂于高價值技術路線,減少研發資源的無效投入;在應用落地層面,為行業用戶開展產品選型與應用驗證提供標準規范支撐,避免市場出現“劣幣驅逐良幣”現象;在產業發展層面,將加速具身智能從實驗室走向真實場景,促進具身智能技術成果的工程化落地和產業化應用。
![]()
圖1 《YD/T 6770-2026 人工智能 關鍵基礎技術 具身智能基準測試方法》
《YD/T 6770-2026 人工智能 關鍵基礎技術 具身智能基準測試方法》概述如圖1,描述了在仿真環境和真實環境下面向具身智能系統的基準測試框架、指標和方法,包括基準測試的環境設置、任務庫構建、測試過程和指標計算方法,適用于單個具身智能系統“感知-決策-執行”全鏈路能力的基準測試。
該標準構建了統一的具身智能基準測試框架(如圖2所示),包括環境設置、測試任務庫、測試過程和指標計算四部分。測試環境方面,規定了仿真測試環境和真實測試環境的構建要求,確保環境設置能反映現實環境的復雜性。測試任務方面,提出了測試任務庫構建方法和泛化評估基準,支撐評估被測對象在不同任務復雜性、不同能力維度上的性能表現和泛化性。測試過程方面,主要面向模型和部署模型的整機系統兩類測試對象開展測試,測試方法包括靜態仿真測試、動態仿真測試、真實環境測試和組合式測試等。測試指標方面,主要包括任務執行效率、任務成功率、人工干預率、場景擾動衰減率和平均任務能耗等五個指標。
![]()
圖 2 具身智能基準測試框架圖
該份行業標準的制定,對具身智能產業各方推動技術進步、產業應用和標準化建設具有重要意義。對研發側,為具身智能的能力評估提供了統一的度量依據,指引技術迭代方向,幫助行業及早識別并收斂于高價值技術路線,減少研發資源的無效投入。對應用側,為行業用戶開展產品選型與應用驗證提供標準規范支撐,避免市場出現“劣幣驅逐良幣”的現象。對產業側,加速具身智能從實驗室走向真實場景,促進具身智能技術成果的工程化落地和產業化應用。
財報直擊 | 中國電信2025年營收5296億元,利潤332億元
財報直擊 | 中國移動2025年營收10502億元
重構財報直擊 | 2025年中國聯通營收3922億元,凈利潤連續6年攀升
責編/版式:孫天
審校:梅雅鑫
監制:劉啟誠
【媒體矩陣】
今日頭條 | 微博 | 微軟MSN | 百家號
網易號 | 人民號 | 騰訊新聞 | 搜狐
新浪看點 | 雪球號 | 知乎
【運營團隊】
編輯|梅雅鑫 孫天 朱文鳳
審校 | 梅雅鑫
監制|劉啟誠
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.