網易首頁 > 網易號 > 正文申請入駐

6月1日起，具身智能領域新標準正式實施

2026-04-01 19:19:29　來源: 通信世界

北京舉報

分享至

工業和信息化部近日批準發布《YD/T 6770—2026 人工智能關鍵基礎技術具身智能基準測試方法》，為具身智能領域首份行業標準，將于6月1日正式實施，標志著具身智能評測邁入“有標可依”的新階段。

該標準為具身智能領域構建了統一基準測試框架，規范了在仿真環境和真實環境下，開展具身智能基準測試的環境設置、任務庫構建、測試過程和指標計算方法。目前該標準已同步推進國際標準立項。

中國信通院有關專家表示，可信的評測體系是連接技術研究與大規模產業應用的橋梁和標尺，該標準將為行業提供統一的技術規范框架、建立互信基礎。在技術研發層面，為具身智能的能力評估提供統一的度量依據，指引技術迭代方向，幫助行業及早識別并收斂于高價值技術路線，減少研發資源的無效投入；在應用落地層面，為行業用戶開展產品選型與應用驗證提供標準規范支撐，避免市場出現“劣幣驅逐良幣”現象；在產業發展層面，將加速具身智能從實驗室走向真實場景，促進具身智能技術成果的工程化落地和產業化應用。

圖1 《YD/T 6770-2026 人工智能關鍵基礎技術具身智能基準測試方法》

《YD/T 6770-2026 人工智能關鍵基礎技術具身智能基準測試方法》概述如圖1，描述了在仿真環境和真實環境下面向具身智能系統的基準測試框架、指標和方法，包括基準測試的環境設置、任務庫構建、測試過程和指標計算方法，適用于單個具身智能系統“感知-決策-執行”全鏈路能力的基準測試。

該標準構建了統一的具身智能基準測試框架（如圖2所示），包括環境設置、測試任務庫、測試過程和指標計算四部分。測試環境方面，規定了仿真測試環境和真實測試環境的構建要求，確保環境設置能反映現實環境的復雜性。測試任務方面，提出了測試任務庫構建方法和泛化評估基準，支撐評估被測對象在不同任務復雜性、不同能力維度上的性能表現和泛化性。測試過程方面，主要面向模型和部署模型的整機系統兩類測試對象開展測試，測試方法包括靜態仿真測試、動態仿真測試、真實環境測試和組合式測試等。測試指標方面，主要包括任務執行效率、任務成功率、人工干預率、場景擾動衰減率和平均任務能耗等五個指標。

圖 2 具身智能基準測試框架圖

該份行業標準的制定，對具身智能產業各方推動技術進步、產業應用和標準化建設具有重要意義。對研發側，為具身智能的能力評估提供了統一的度量依據，指引技術迭代方向，幫助行業及早識別并收斂于高價值技術路線，減少研發資源的無效投入。對應用側，為行業用戶開展產品選型與應用驗證提供標準規范支撐，避免市場出現“劣幣驅逐良幣”的現象。對產業側，加速具身智能從實驗室走向真實場景，促進具身智能技術成果的工程化落地和產業化應用。

財報直擊 | 中國電信2025年營收5296億元，利潤332億元

財報直擊 | 中國移動2025年營收10502億元

重構財報直擊 | 2025年中國聯通營收3922億元，凈利潤連續6年攀升

責編/版式：孫天

審校：梅雅鑫

監制：劉啟誠

【媒體矩陣】

今日頭條 | 微博 | 微軟MSN | 百家號

網易號 | 人民號 | 騰訊新聞 | 搜狐

新浪看點 | 雪球號 | 知乎

【運營團隊】

編輯｜梅雅鑫孫天朱文鳳

審校 | 梅雅鑫

監制｜劉啟誠

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.