![]()
整理 | 屠敏
出品 | CSDN(ID:CSDNnews)
上周,在全球最大的大模型 API 聚合平臺(tái) OpenRouter 上,一款代號(hào)為 Hunter Alpha 的神秘模型調(diào)用量一路飆升至榜首,迅速成為圈內(nèi)熱議的焦點(diǎn)。
![]()
在外界還在猜測(cè)這個(gè)“幕后玩家”究竟是誰(shuí)時(shí),答案很快揭曉——今天,小米正式出面認(rèn)領(lǐng),并發(fā)布了這款模型的真實(shí)身份:MiMo-V2-Pro。此外,其還推出了相關(guān)系列模型MiMo-V2-Omni 和 TTS。
這款模型一亮相就直接把關(guān)注度拉滿:萬(wàn)億參數(shù)規(guī)模,性能對(duì)標(biāo) GPT-5.2 和 Claude Opus 4.6,而通過(guò)自有 API 調(diào)用的成本卻壓到對(duì)手的約六分之一到七分之一。
此項(xiàng)目由小米 AI 實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人、前 DeepSeek R1 核心成員羅福莉領(lǐng)銜,她將這次發(fā)布形容為一次“悄無(wú)聲息的伏擊”。
隨即,雷軍也在微博發(fā)文確認(rèn),小米上周在 OpenRouter 匿名發(fā)布的 MiMo?V2?Pro 不僅快速登頂日榜,如今更是成為周榜第一。
![]()
![]()
MiMo?V2?Pro 登場(chǎng),直接生成
很多人對(duì)大模型的印象,還停留在陪人聊天、寫文案、答問(wèn)題。但 MiMo?V2?Pro 從設(shè)計(jì)之初就走向了另一條路徑。
它的能力不再局限于“回答問(wèn)題”、“生成 Demo”,而是被打造為 Agent 時(shí)代的執(zhí)行中樞。換句話說(shuō),它更像復(fù)雜系統(tǒng)的“中央大腦”,可以直接參與代碼生成、終端執(zhí)行、長(zhǎng)流程任務(wù)規(guī)劃,甚至多智能體協(xié)同與企業(yè)級(jí)知識(shí)處理。
在羅福莉的描述中,這是“小米首個(gè)真正為 Agent 時(shí)代構(gòu)建的全棧模型體系”。
小米對(duì)它的定位也很明確:不只是工具,而是要成為驅(qū)動(dòng)各類系統(tǒng)與工作流的底層核心,在真實(shí)生產(chǎn)環(huán)境中持續(xù)產(chǎn)生價(jià)值。
此次發(fā)布之際,小米也曬出了 MiMo-V2-Pro 的一些成果,其已經(jīng)不只是“能生成代碼”,而是更接近“直接交付成品”。
譬如讓 MiMo-V2-Pro 用 Three.js 或 Babylon.js 開(kāi)發(fā)一款 3D 塔防游戲,得到的結(jié)果如下:
此外,當(dāng)模型被要求復(fù)刻一種帶有 1990 年代印刷雜志風(fēng)格的網(wǎng)頁(yè)設(shè)計(jì):標(biāo)題使用襯線字體,正文采用等寬字體,整體采用多欄排版,版式還刻意帶有不對(duì)稱結(jié)構(gòu)和“出血”效果;圖片帶有褐色濾鏡與顆粒噪點(diǎn),頁(yè)面切換模擬翻頁(yè)效果;導(dǎo)航被設(shè)計(jì)成類似雜志目錄的樣式,每一項(xiàng)帶編號(hào)并在懸停時(shí)放大;底部則還原為類似“出版信息”的版塊,甚至包含虛構(gòu)的 ISSN 號(hào)。
在這樣的復(fù)雜提示下,MiMo-V2-Pro 能夠一次性生成結(jié)構(gòu)完整、風(fēng)格統(tǒng)一的網(wǎng)頁(yè),而不僅僅是零散片段,整體更接近可直接使用的成品。
![]()
萬(wàn)億參數(shù)模型揭曉
不過(guò),“智能體時(shí)代”的核心挑戰(zhàn),是在海量數(shù)據(jù)范圍內(nèi)保持高保真的推理能力,同時(shí)避免因延遲或成本帶來(lái)的“智能稅”。
根據(jù)官方介紹,MiMo-V2-Pro 通過(guò)稀疏架構(gòu)來(lái)應(yīng)對(duì)這一問(wèn)題。雖然該模型的總參數(shù)達(dá)到 1 萬(wàn)億,但在實(shí)際運(yùn)行時(shí),單次僅激活 420 億參數(shù),規(guī)模約為 MiMo-V2-Flash 的 3 倍。
底層架構(gòu)設(shè)計(jì)上,其效率來(lái)自進(jìn)化后的混合注意力機(jī)制。傳統(tǒng) Transformer 在上下文增長(zhǎng)時(shí)計(jì)算復(fù)雜度呈平方級(jí)上升,而 MiMo-V2-Pro 采用 7:1 的混合比例(較 Flash 版本的 5:1 有所提升),來(lái)管理高達(dá) 100 萬(wàn) token 的上下文窗口。
這一設(shè)計(jì)讓模型在處理長(zhǎng)時(shí)任務(wù)時(shí)依然能夠保持“深度記憶”,而不會(huì)出現(xiàn)性能明顯下降。
此外,模型還結(jié)合了輕量級(jí)的 MTP 多 token 預(yù)測(cè)層,使其能夠同時(shí)預(yù)測(cè)多個(gè) token,大幅降低智能體工作流中“思考階段”的延遲。
羅福莉表示,這些結(jié)構(gòu)性設(shè)計(jì)早在數(shù)月前就已確定,目的是在行業(yè)突然轉(zhuǎn)向智能體時(shí)獲得“結(jié)構(gòu)性優(yōu)勢(shì)”。
![]()
MiMo-V2-Pro 位列全球第八,國(guó)內(nèi)第二
在具體性能表現(xiàn)維度,根據(jù)小米官方分享的基準(zhǔn)測(cè)試結(jié)果顯示,MiMo-V2-Pro 在主流智能體基準(zhǔn)測(cè)試中表現(xiàn)出色。其編碼能力超越了 Claude 4.6 Sonnet,通用智能體性能(ClawEval)接近 Opus 4.6。工具調(diào)用穩(wěn)定性和準(zhǔn)確率也得到了顯著提升。
![]()
此外,據(jù)第三方機(jī)構(gòu) Artificial Analysis 的評(píng)測(cè)顯示,MiMo-V2-Pro 拿下全球第八,國(guó)內(nèi)第二的好成績(jī)。
從細(xì)分維度來(lái)看:
? MiMo-V2-Pro 在 Artificial Analysis 智能指數(shù)中得分 49,僅次于 GLM-5(推理版,50 分),高于 Kimi K2.5(47 分)和 Qwen3.5 397B A17B(45 分)。在綜合榜單中排名第 10,位于 GPT-5.2 Codex(49 分)之后、Grok 4.20 Beta(48 分)之前。
? 在 GDPval-AA(面向真實(shí)世界任務(wù)的智能體基準(zhǔn))中,MiMo-V2-Pro 以 1426 Elo 領(lǐng)先同類模型,包括 GLM-5(1406)、Kimi K2.5(1283)和 Qwen3.5 397B A17B(1209)。相比之下,GPT-5.4 和 Claude Sonnet 4.6 的 Elo 分別為 1667 和 1633。
? 憑借較低的幻覺(jué)率,MiMo-V2-Pro 在 AA 全知指數(shù)(Omniscience Index)中獲得 +5,領(lǐng)先 GLM-5(+2)、Kimi K2.5(-8)和 Qwen3.5(-30)。不過(guò),Claude Opus 4.6(+14)和 Gemini 3.1 Pro Preview(+33)仍然更高。
? 在 token 使用效率方面,MiMo-V2-Pro 更加精簡(jiǎn):完成整套評(píng)測(cè)僅使用 7700 萬(wàn)輸出 token,顯著低于 GLM-5(1.09 億)和 Kimi K2.5(8900 萬(wàn))。
![]()
如果說(shuō)接近第一梯隊(duì)的性能是驚喜,那么同樣讓人驚訝的還有它的成本。
![]()
成本僅為主流競(jìng)品的六分之一到七分之一
Artificial Analysis 實(shí)測(cè)數(shù)據(jù)顯示,MiMo-V2-Pro 運(yùn)行整套智能指數(shù)測(cè)試僅需 348 美元(按輸入 $1 / 輸出 $3 每百萬(wàn) token 計(jì)費(fèi))。
盡管得分僅比 GLM-5 低 1 分,但成本更低。
相比之下,GPT-5.2 約為 2304 美元,Claude Opus 4.6 約為 2486 美元。同樣的任務(wù),小米模型的成本僅為這些主流競(jìng)品的六分之一到七分之一。
與此同時(shí),小米為 MiMo-V2-Pro 制定了極具攻擊性的定價(jià)策略:
MiMo-V2-Pro(≤256K):每百萬(wàn)輸入 tokens 1 美元,每百萬(wàn)輸出 tokens 3 美元
MiMo-V2-Pro(256K–1M):每百萬(wàn)輸入 tokens 2 美元,每百萬(wàn)輸出 tokens 6 美元
緩存讀取(Cache read):低檔為每百萬(wàn) tokens 0.20 美元,高檔為每百萬(wàn) tokens 0.40 美元
緩存寫入(Cache write):暫時(shí)免費(fèi)(0 美元)
相較其他領(lǐng)先前沿模型,小米的這種定價(jià)策略,也直接打破了“頂級(jí)大模型=極高成本”的行業(yè)慣例,讓中小企業(yè)、普通開(kāi)發(fā)者都能用上接近 GPT?5.2 水平的 AI 能力。顯然,小米的這一策略明顯意在搶占開(kāi)發(fā)者市場(chǎng),推動(dòng)高強(qiáng)度應(yīng)用場(chǎng)景的落地。
![]()
![]()
羅福莉揭曉MiMo?V2?Pro 落地的背后思考
MiMo?V2?Pro 的橫空出世,離不開(kāi)核心負(fù)責(zé)人羅福莉。
對(duì)于這次發(fā)布,羅福莉也在 X 平臺(tái)上分享了這款新模型訓(xùn)練的過(guò)程與自己的思考,她表示:
「這個(gè)萬(wàn)億參數(shù)的基礎(chǔ)模型幾個(gè)月前就已經(jīng)啟動(dòng)訓(xùn)練,最初的目標(biāo)是提升長(zhǎng)上下文推理效率。Hybrid Attention 帶來(lái)了真正的創(chuàng)新,但又不過(guò)度激進(jìn),結(jié)果證明它恰好成為 Agent 時(shí)代的理想基礎(chǔ):支持 100 萬(wàn)上下文窗口,結(jié)合 MTP 推理實(shí)現(xiàn)超低延遲與成本。這些架構(gòu)選擇并不是追逐熱點(diǎn),而是我們?cè)谛枨笳嬲l(fā)前就構(gòu)建好的“結(jié)構(gòu)性優(yōu)勢(shì)”。
真正改變一切的,是第一次體驗(yàn)復(fù)雜的 agentic scaffold——我更愿意稱之為“編排后的上下文”(orchestrated context)。那一刻非常震撼。第一天我就試圖說(shuō)服團(tuán)隊(duì)去用,但沒(méi)人買賬。于是我下了一個(gè)硬性要求:MiMo 團(tuán)隊(duì)里,如果第二天對(duì)話數(shù)少于 100 次,可以直接離開(kāi)。結(jié)果證明,這一招奏效了。一旦團(tuán)隊(duì)真正理解了 Agent 系統(tǒng)的潛力,這種想象力就會(huì)直接轉(zhuǎn)化為研究速度。
很多人問(wèn)我們?yōu)槭裁茨芡七M(jìn)這么快。我在做 DeepSeek R1 時(shí)就親身經(jīng)歷過(guò),可以簡(jiǎn)單總結(jié)為:
—基礎(chǔ)模型和基礎(chǔ)設(shè)施研究周期很長(zhǎng),需要在一年前就建立戰(zhàn)略判斷
— 后訓(xùn)練階段則完全不同,更依賴產(chǎn)品直覺(jué)驅(qū)動(dòng)評(píng)估,迭代節(jié)奏更快,也更容易捕捉范式變化
— 而始終不變的,是好奇心、敏銳的技術(shù)直覺(jué)、果斷執(zhí)行、全情投入,以及一個(gè)常被低估的因素:對(duì)你正在構(gòu)建的世界發(fā)自內(nèi)心的熱愛(ài)
我們會(huì)開(kāi)源——等模型足夠穩(wěn)定、真正“配得上”開(kāi)源的時(shí)候。」
![]()
![]()
雷軍:Mimo-V2-Pro超過(guò)了 xAI Grok
在模型推出的第一時(shí)間,雷軍也親自站臺(tái)發(fā)文慶賀道:“在全球大模型綜合智能排行榜 Artificial Analysis 上,Mimo-V2-Pro 位列全球第八。按大模型品牌來(lái)排名,排在全球第五,超過(guò)了 xAI Grok。我們模型剛剛完成,未來(lái)一段時(shí)間,還會(huì)快速迭代增強(qiáng)。小米在 AI 領(lǐng)域上相對(duì)比較低調(diào),實(shí)際進(jìn)展可能比大家看到的要快很多。”
同時(shí)他還透露,在 AI 領(lǐng)域,小米今年的研發(fā)和資本投入就將超過(guò) 160 億元。
![]()
對(duì)全球 AI 行業(yè)而言,小米發(fā)布 MiMo?V2?Pro,遠(yuǎn)不止是推出一款新模型,它更像一個(gè)信號(hào):AI 正在從“會(huì)說(shuō)話”,走向“能做事”。
從性能到成本,從架構(gòu)到定位,小米試圖回答一個(gè)更本質(zhì)的問(wèn)題——在智能體時(shí)代,模型到底應(yīng)該如何參與世界?
而 MiMo-V2-Pro,只是這個(gè)方向的起點(diǎn)。如果說(shuō)過(guò)去的競(jìng)爭(zhēng)是“誰(shuí)更會(huì)對(duì)話”,那么接下來(lái)的競(jìng)爭(zhēng),可能會(huì)變成——誰(shuí)更能行動(dòng)。
https://mimo.xiaomi.com/mimo-v2-pro
https://weibo.com/u/1749127163
https://x.com/_LuoFuli/status/2034379957913129140
https://x.com/ArtificialAnlys/status/2034239267052896516
https://venturebeat.com/technology/xiaomi-stuns-with-new-mimo-v2-pro-llm-nearing-gpt-5-2-opus-4-6-performance
【活動(dòng)分享】“48 小時(shí),與 50+ 位大廠技術(shù)決策者,共探 AI 落地真路徑。”由 CSDN 與奇點(diǎn)智能研究院聯(lián)合舉辦的「全球機(jī)器學(xué)習(xí)技術(shù)大會(huì)」正式升級(jí)為「奇點(diǎn)智能技術(shù)大會(huì)」。2026 奇點(diǎn)智能技術(shù)大會(huì)將于 4 月 17-18 日在上海環(huán)球港凱悅酒店正式召開(kāi),大會(huì)聚焦大模型技術(shù)演進(jìn)、智能體系統(tǒng)工程、OpenClaw 生態(tài)實(shí)踐及 AI 行業(yè)落地等十二大專題板塊,特邀來(lái)自BAT、京東、微軟、小紅書、美團(tuán)等頭部企業(yè)的 50+ 位技術(shù)決策者分享實(shí)戰(zhàn)案例。這不僅是一場(chǎng)技術(shù)的盛宴,更是決策者把握 2026 AI 拐點(diǎn)的戰(zhàn)略機(jī)會(huì)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.