2026年2月12日消息,小米開源首代機器人VLA大模型Xiaomi-Robotics-0,通過采用“大腦+小腦”混合架構實現實時控制,在三大主流的仿真測試和現實真機任務中均獲得優異成績。
![]()
據了解,這是一個擁有47億參數、兼具視覺語言理解與高性能實時執行能力的開源 VLA 模型。它不僅在三大主流的仿真測試中獲得優異成績,更在現實真機任務中實現了物理智能的泛化,動作連貫、反應靈敏,且能在消費級顯卡上實現實時推理。同時,模型“大腦”基于多模態視覺語言模型,負責理解人類指令與空間關系;“小腦”采用多層Diffusion Transformer,生成高頻、平滑的動作塊,實現精準連貫的物理操作。
![]()
此外,模型具備強泛化能力,既能執行操作又不丟失視覺理解與邏輯推理能力,實現“既會干活,也能答問”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.