網易首頁 > 網易號 > 正文申請入駐

達摩院開源具身大腦基模RynnBrain，登頂16項榜單，超越Gemini

2026-02-10 11:08:07　來源: 獵云網

北京舉報

分享至

2月10日，阿里巴巴達摩院發布具身智能大腦基礎模型RynnBrain，并一次性開源了包括30B MoE在內的7個全系列模型。RynnBrain首次讓機器人擁有了時空記憶和空間推理能力，智能水平實現大幅躍升，在16項具身開源評測榜單上刷新紀錄（SOTA），超越谷歌Gemini Robotics ER 1.5等行業頂尖模型。

據介紹，具身模型的智能水平已成為行業發展的重要瓶頸，尤其是泛化能力亟待提升。業界形成了多條技術路線的探索：一類是動作模型，從機器人末端動作輸出著手，發展出可以直接操作物理世界的VLA模型，但VLA模型往往因為數據稀缺難以實現泛化；另一類是大腦模型，從本身具有泛化能力的VLM等模型入手，但他們普遍缺乏記憶能力，動態認知受限，且普遍存在物理幻覺，難以支持人形機器人復雜的移動操作。

為了克服這些問題，達摩院的RynnBrain模型創造性地引入了時空記憶和物理世界推理，這是機器人與環境互動所需的兩項基本能力。時空記憶能力可讓機器人在其完整的歷史記憶中定位物體、目標區域，甚至預測運動軌跡，從而賦予機器人全局時空回溯能力。物理空間推理不同于傳統的純文本推理范式，RynnBrain 采用文本與空間定位交錯進行的推理策略，確保其推理過程緊密扎根于物理環境，大大減弱了幻覺問題。舉例來說，運行RynnBrain模型的機器人，在執行A任務中被突然打斷要求先做B任務，它能記住A任務的時間和空間狀態，等完成B后繼續工作。

RynnBrain具有認知、定位、推理、規劃等多重能力

RynnBrain在Qwen3-VL基礎上訓練，使用自研的RynnScale架構進行訓練優化，同等資源加速兩倍，訓練數據超過2000萬對。結果顯示，RynnBrain能力全面，性能領先，在16項具身開源評測榜單上刷新紀錄（SOTA），包括環境感知與對象推理、第一人稱視覺問答、空間推理、軌跡預測等，超越了谷歌Gemini Robotics ER 1.5、英偉達 Cosmos Reason 2等具身頂尖模型。

RynnBrain在16項具身評測上實現SOTA

RynnBrain還擁有良好的可拓展性，能夠快速后訓練出導航、規劃、動作等多種具身模型，有望成為具身行業的基礎模型。以具身規劃模型為例，其需要強大預測能力和場景解析能力，但基于RynnBrain為基礎，只需幾百條數據微調，效果就能超越Gemini 3 Pro，輕松實現SOTA。

以開源完整的推理與訓練代碼的方式，達摩院此次開源了RynnBrain全系列模型，共計7個，包含全尺寸基礎模型與后訓練專有模型，其中有業界首個MoE架構的30B具身模型，只需要3B的推理激活參數就能超越業界的72B模型效果，因此能讓機器人動作更快、更絲滑。同時，達摩院還開源了全新評測基準 RynnBrain-Bench，用于評測時空細粒度具身任務，填補了行業空白。

RynnBrain模型架構

達摩院具身智能實驗室負責人趙德麗表示：“RynnBrain 首次實現了大腦對物理世界的深度理解與可靠規劃，為大小腦分層架構下的通用具身智能邁出關鍵一步。我們期待它加速 AI 從數字世界走向真實物理場景的落地進程。”據了解，達摩院積極投入具身智能，正在構建可部署、可擴展、可進化的具身智能系統，已開源了融合世界模型和VLA模型的WorldVLA、世界理解模型 RynnEC等具身模型，以及業界首個機器人上下文協議 RynnRCP 。

github: https://github.com/alibaba-damo-academy/RynnBrain

huggingface: https://huggingface.co/collections/Alibaba-DAMO-Academy/rynnbrain

主頁：https://alibaba-damo-academy.github.io/RynnBrain.github.io/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.