網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

小米深夜認(rèn)領(lǐng)榜一神秘大模型，MiMo-V2-Pro重磅發(fā)布！雷軍直言：已超馬斯克的Grok

2026-03-19 20:31:18　來(lái)源: CSDN

北京舉報(bào)

分享至

整理 | 屠敏

出品 | CSDN（ID：CSDNnews）

上周，在全球最大的大模型 API 聚合平臺(tái) OpenRouter 上，一款代號(hào)為 Hunter Alpha 的神秘模型調(diào)用量一路飆升至榜首，迅速成為圈內(nèi)熱議的焦點(diǎn)。

在外界還在猜測(cè)這個(gè)“幕后玩家”究竟是誰(shuí)時(shí)，答案很快揭曉——今天，小米正式出面認(rèn)領(lǐng)，并發(fā)布了這款模型的真實(shí)身份：MiMo-V2-Pro。此外，其還推出了相關(guān)系列模型MiMo-V2-Omni 和 TTS。

這款模型一亮相就直接把關(guān)注度拉滿：萬(wàn)億參數(shù)規(guī)模，性能對(duì)標(biāo) GPT-5.2 和 Claude Opus 4.6，而通過(guò)自有 API 調(diào)用的成本卻壓到對(duì)手的約六分之一到七分之一。

此項(xiàng)目由小米 AI 實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人、前 DeepSeek R1 核心成員羅福莉領(lǐng)銜，她將這次發(fā)布形容為一次“悄無(wú)聲息的伏擊”。

隨即，雷軍也在微博發(fā)文確認(rèn)，小米上周在 OpenRouter 匿名發(fā)布的 MiMo?V2?Pro 不僅快速登頂日榜，如今更是成為周榜第一。

MiMo?V2?Pro 登場(chǎng)，直接生成

很多人對(duì)大模型的印象，還停留在陪人聊天、寫文案、答問(wèn)題。但 MiMo?V2?Pro 從設(shè)計(jì)之初就走向了另一條路徑。

它的能力不再局限于“回答問(wèn)題”、“生成 Demo”，而是被打造為 Agent 時(shí)代的執(zhí)行中樞。換句話說(shuō)，它更像復(fù)雜系統(tǒng)的“中央大腦”，可以直接參與代碼生成、終端執(zhí)行、長(zhǎng)流程任務(wù)規(guī)劃，甚至多智能體協(xié)同與企業(yè)級(jí)知識(shí)處理。

在羅福莉的描述中，這是“小米首個(gè)真正為 Agent 時(shí)代構(gòu)建的全棧模型體系”。

小米對(duì)它的定位也很明確：不只是工具，而是要成為驅(qū)動(dòng)各類系統(tǒng)與工作流的底層核心，在真實(shí)生產(chǎn)環(huán)境中持續(xù)產(chǎn)生價(jià)值。

此次發(fā)布之際，小米也曬出了 MiMo-V2-Pro 的一些成果，其已經(jīng)不只是“能生成代碼”，而是更接近“直接交付成品”。

譬如讓 MiMo-V2-Pro 用 Three.js 或 Babylon.js 開(kāi)發(fā)一款 3D 塔防游戲，得到的結(jié)果如下：

此外，當(dāng)模型被要求復(fù)刻一種帶有 1990 年代印刷雜志風(fēng)格的網(wǎng)頁(yè)設(shè)計(jì)：標(biāo)題使用襯線字體，正文采用等寬字體，整體采用多欄排版，版式還刻意帶有不對(duì)稱結(jié)構(gòu)和“出血”效果；圖片帶有褐色濾鏡與顆粒噪點(diǎn)，頁(yè)面切換模擬翻頁(yè)效果；導(dǎo)航被設(shè)計(jì)成類似雜志目錄的樣式，每一項(xiàng)帶編號(hào)并在懸停時(shí)放大；底部則還原為類似“出版信息”的版塊，甚至包含虛構(gòu)的 ISSN 號(hào)。

在這樣的復(fù)雜提示下，MiMo-V2-Pro 能夠一次性生成結(jié)構(gòu)完整、風(fēng)格統(tǒng)一的網(wǎng)頁(yè)，而不僅僅是零散片段，整體更接近可直接使用的成品。

萬(wàn)億參數(shù)模型揭曉

不過(guò)，“智能體時(shí)代”的核心挑戰(zhàn)，是在海量數(shù)據(jù)范圍內(nèi)保持高保真的推理能力，同時(shí)避免因延遲或成本帶來(lái)的“智能稅”。

根據(jù)官方介紹，MiMo-V2-Pro 通過(guò)稀疏架構(gòu)來(lái)應(yīng)對(duì)這一問(wèn)題。雖然該模型的總參數(shù)達(dá)到 1 萬(wàn)億，但在實(shí)際運(yùn)行時(shí)，單次僅激活 420 億參數(shù)，規(guī)模約為 MiMo-V2-Flash 的 3 倍。

底層架構(gòu)設(shè)計(jì)上，其效率來(lái)自進(jìn)化后的混合注意力機(jī)制。傳統(tǒng) Transformer 在上下文增長(zhǎng)時(shí)計(jì)算復(fù)雜度呈平方級(jí)上升，而 MiMo-V2-Pro 采用 7:1 的混合比例（較 Flash 版本的 5:1 有所提升），來(lái)管理高達(dá) 100 萬(wàn) token 的上下文窗口。

這一設(shè)計(jì)讓模型在處理長(zhǎng)時(shí)任務(wù)時(shí)依然能夠保持“深度記憶”，而不會(huì)出現(xiàn)性能明顯下降。

此外，模型還結(jié)合了輕量級(jí)的 MTP 多 token 預(yù)測(cè)層，使其能夠同時(shí)預(yù)測(cè)多個(gè) token，大幅降低智能體工作流中“思考階段”的延遲。

羅福莉表示，這些結(jié)構(gòu)性設(shè)計(jì)早在數(shù)月前就已確定，目的是在行業(yè)突然轉(zhuǎn)向智能體時(shí)獲得“結(jié)構(gòu)性優(yōu)勢(shì)”。

MiMo-V2-Pro 位列全球第八，國(guó)內(nèi)第二

在具體性能表現(xiàn)維度，根據(jù)小米官方分享的基準(zhǔn)測(cè)試結(jié)果顯示，MiMo-V2-Pro 在主流智能體基準(zhǔn)測(cè)試中表現(xiàn)出色。其編碼能力超越了 Claude 4.6 Sonnet，通用智能體性能（ClawEval）接近 Opus 4.6。工具調(diào)用穩(wěn)定性和準(zhǔn)確率也得到了顯著提升。

此外，據(jù)第三方機(jī)構(gòu) Artificial Analysis 的評(píng)測(cè)顯示，MiMo-V2-Pro 拿下全球第八，國(guó)內(nèi)第二的好成績(jī)。

從細(xì)分維度來(lái)看：

? MiMo-V2-Pro 在 Artificial Analysis 智能指數(shù)中得分 49，僅次于 GLM-5（推理版，50 分），高于 Kimi K2.5（47 分）和 Qwen3.5 397B A17B（45 分）。在綜合榜單中排名第 10，位于 GPT-5.2 Codex（49 分）之后、Grok 4.20 Beta（48 分）之前。

? 在 GDPval-AA（面向真實(shí)世界任務(wù)的智能體基準(zhǔn)）中，MiMo-V2-Pro 以 1426 Elo 領(lǐng)先同類模型，包括 GLM-5（1406）、Kimi K2.5（1283）和 Qwen3.5 397B A17B（1209）。相比之下，GPT-5.4 和 Claude Sonnet 4.6 的 Elo 分別為 1667 和 1633。

? 憑借較低的幻覺(jué)率，MiMo-V2-Pro 在 AA 全知指數(shù)（Omniscience Index）中獲得 +5，領(lǐng)先 GLM-5（+2）、Kimi K2.5（-8）和 Qwen3.5（-30）。不過(guò)，Claude Opus 4.6（+14）和 Gemini 3.1 Pro Preview（+33）仍然更高。

? 在 token 使用效率方面，MiMo-V2-Pro 更加精簡(jiǎn)：完成整套評(píng)測(cè)僅使用 7700 萬(wàn)輸出 token，顯著低于 GLM-5（1.09 億）和 Kimi K2.5（8900 萬(wàn)）。

如果說(shuō)接近第一梯隊(duì)的性能是驚喜，那么同樣讓人驚訝的還有它的成本。

成本僅為主流競(jìng)品的六分之一到七分之一

Artificial Analysis 實(shí)測(cè)數(shù)據(jù)顯示，MiMo-V2-Pro 運(yùn)行整套智能指數(shù)測(cè)試僅需 348 美元（按輸入 $1 / 輸出 $3 每百萬(wàn) token 計(jì)費(fèi)）。

盡管得分僅比 GLM-5 低 1 分，但成本更低。

相比之下，GPT-5.2 約為 2304 美元，Claude Opus 4.6 約為 2486 美元。同樣的任務(wù)，小米模型的成本僅為這些主流競(jìng)品的六分之一到七分之一。

與此同時(shí)，小米為 MiMo-V2-Pro 制定了極具攻擊性的定價(jià)策略：

MiMo-V2-Pro（≤256K）：每百萬(wàn)輸入 tokens 1 美元，每百萬(wàn)輸出 tokens 3 美元
MiMo-V2-Pro（256K–1M）：每百萬(wàn)輸入 tokens 2 美元，每百萬(wàn)輸出 tokens 6 美元
緩存讀取（Cache read）：低檔為每百萬(wàn) tokens 0.20 美元，高檔為每百萬(wàn) tokens 0.40 美元
緩存寫入（Cache write）：暫時(shí)免費(fèi)（0 美元）

相較其他領(lǐng)先前沿模型，小米的這種定價(jià)策略，也直接打破了“頂級(jí)大模型=極高成本”的行業(yè)慣例，讓中小企業(yè)、普通開(kāi)發(fā)者都能用上接近 GPT?5.2 水平的 AI 能力。顯然，小米的這一策略明顯意在搶占開(kāi)發(fā)者市場(chǎng)，推動(dòng)高強(qiáng)度應(yīng)用場(chǎng)景的落地。

羅福莉揭曉MiMo?V2?Pro 落地的背后思考

MiMo?V2?Pro 的橫空出世，離不開(kāi)核心負(fù)責(zé)人羅福莉。

對(duì)于這次發(fā)布，羅福莉也在 X 平臺(tái)上分享了這款新模型訓(xùn)練的過(guò)程與自己的思考，她表示：

「這個(gè)萬(wàn)億參數(shù)的基礎(chǔ)模型幾個(gè)月前就已經(jīng)啟動(dòng)訓(xùn)練，最初的目標(biāo)是提升長(zhǎng)上下文推理效率。Hybrid Attention 帶來(lái)了真正的創(chuàng)新，但又不過(guò)度激進(jìn)，結(jié)果證明它恰好成為 Agent 時(shí)代的理想基礎(chǔ)：支持 100 萬(wàn)上下文窗口，結(jié)合 MTP 推理實(shí)現(xiàn)超低延遲與成本。這些架構(gòu)選擇并不是追逐熱點(diǎn)，而是我們?cè)谛枨笳嬲l(fā)前就構(gòu)建好的“結(jié)構(gòu)性優(yōu)勢(shì)”。

真正改變一切的，是第一次體驗(yàn)復(fù)雜的 agentic scaffold——我更愿意稱之為“編排后的上下文”（orchestrated context）。那一刻非常震撼。第一天我就試圖說(shuō)服團(tuán)隊(duì)去用，但沒(méi)人買賬。于是我下了一個(gè)硬性要求：MiMo 團(tuán)隊(duì)里，如果第二天對(duì)話數(shù)少于 100 次，可以直接離開(kāi)。結(jié)果證明，這一招奏效了。一旦團(tuán)隊(duì)真正理解了 Agent 系統(tǒng)的潛力，這種想象力就會(huì)直接轉(zhuǎn)化為研究速度。

很多人問(wèn)我們?yōu)槭裁茨芡七M(jìn)這么快。我在做 DeepSeek R1 時(shí)就親身經(jīng)歷過(guò)，可以簡(jiǎn)單總結(jié)為：

—基礎(chǔ)模型和基礎(chǔ)設(shè)施研究周期很長(zhǎng)，需要在一年前就建立戰(zhàn)略判斷

— 后訓(xùn)練階段則完全不同，更依賴產(chǎn)品直覺(jué)驅(qū)動(dòng)評(píng)估，迭代節(jié)奏更快，也更容易捕捉范式變化

— 而始終不變的，是好奇心、敏銳的技術(shù)直覺(jué)、果斷執(zhí)行、全情投入，以及一個(gè)常被低估的因素：對(duì)你正在構(gòu)建的世界發(fā)自內(nèi)心的熱愛(ài)

我們會(huì)開(kāi)源——等模型足夠穩(wěn)定、真正“配得上”開(kāi)源的時(shí)候。」

雷軍：Mimo-V2-Pro超過(guò)了 xAI Grok

在模型推出的第一時(shí)間，雷軍也親自站臺(tái)發(fā)文慶賀道：“在全球大模型綜合智能排行榜 Artificial Analysis 上，Mimo-V2-Pro 位列全球第八。按大模型品牌來(lái)排名，排在全球第五，超過(guò)了 xAI Grok。我們模型剛剛完成，未來(lái)一段時(shí)間，還會(huì)快速迭代增強(qiáng)。小米在 AI 領(lǐng)域上相對(duì)比較低調(diào)，實(shí)際進(jìn)展可能比大家看到的要快很多。”

同時(shí)他還透露，在 AI 領(lǐng)域，小米今年的研發(fā)和資本投入就將超過(guò) 160 億元。

對(duì)全球 AI 行業(yè)而言，小米發(fā)布 MiMo?V2?Pro，遠(yuǎn)不止是推出一款新模型，它更像一個(gè)信號(hào)：AI 正在從“會(huì)說(shuō)話”，走向“能做事”。

從性能到成本，從架構(gòu)到定位，小米試圖回答一個(gè)更本質(zhì)的問(wèn)題——在智能體時(shí)代，模型到底應(yīng)該如何參與世界？

而 MiMo-V2-Pro，只是這個(gè)方向的起點(diǎn)。如果說(shuō)過(guò)去的競(jìng)爭(zhēng)是“誰(shuí)更會(huì)對(duì)話”，那么接下來(lái)的競(jìng)爭(zhēng)，可能會(huì)變成——誰(shuí)更能行動(dòng)。

https://mimo.xiaomi.com/mimo-v2-pro

https://weibo.com/u/1749127163

https://x.com/_LuoFuli/status/2034379957913129140

https://x.com/ArtificialAnlys/status/2034239267052896516

https://venturebeat.com/technology/xiaomi-stuns-with-new-mimo-v2-pro-llm-nearing-gpt-5-2-opus-4-6-performance

【活動(dòng)分享】“48 小時(shí)，與 50+ 位大廠技術(shù)決策者，共探 AI 落地真路徑。”由 CSDN 與奇點(diǎn)智能研究院聯(lián)合舉辦的「全球機(jī)器學(xué)習(xí)技術(shù)大會(huì)」正式升級(jí)為「奇點(diǎn)智能技術(shù)大會(huì)」。2026 奇點(diǎn)智能技術(shù)大會(huì)將于 4 月 17-18 日在上海環(huán)球港凱悅酒店正式召開(kāi)，大會(huì)聚焦大模型技術(shù)演進(jìn)、智能體系統(tǒng)工程、OpenClaw 生態(tài)實(shí)踐及 AI 行業(yè)落地等十二大專題板塊，特邀來(lái)自BAT、京東、微軟、小紅書、美團(tuán)等頭部企業(yè)的 50+ 位技術(shù)決策者分享實(shí)戰(zhàn)案例。這不僅是一場(chǎng)技術(shù)的盛宴，更是決策者把握 2026 AI 拐點(diǎn)的戰(zhàn)略機(jī)會(huì)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.