網易首頁 > 網易號 > 正文申請入駐

羅福莉首秀前，小米突然發布！代碼全球最強，總體媲美DeepSeek-V3.2【附實測】

2025-12-17 09:18:10　來源: 智東西

北京舉報

分享至

智東西
作者程茜
編輯李水青

智東西12月17日報道，今天，小米發布并開源了最新MoE大模型MiMo-V2-Flash，總參數309B，激活參數15B。今日上午，小米2025小米人車家全生態合作伙伴大會上，Xiaomi MiMO大模型負責人羅福莉將首秀并發布主題演講。

該模型專為推理、編碼和Agent場景構建，支持混合思維模式，允許用戶切換模型是“思考”還是即時回答。它能一鍵生成功能齊全的HTML網頁，并與Claude Code、Cursor和Cline等氛圍編碼框架協同。該模型提供256k上下文窗口，能夠完成數百輪Agent交互和工具調用的任務。

基準測試結果顯示，MiMo-V2-Flash的性能基本與DeepSeek-V3.2相當，僅在不使用任何工具輔助的“人類最后一場考試”和創意文本生成評估ARENA-HARD中略遜色于DeepSeek-V3.2，但時延更小。

MiMo-V2-Flash能以每秒150個token的速度實現極其快速的推理，價格方面，其每百萬輸入token 0.7元、每百萬輸出token 2.1元。

小米已經開源了MiMo-V2-Flash所有內容，并向開發者社區SGLang貢獻了所有推理代碼，API限時免費。目前，用戶可以在網頁端免費體驗MiMo-V2-Flash。

開源地址：https://t.co/4Etm0yZKTL

體驗地址：https://aistudio.xiaomimimo.com/#/

技術報告：https://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

一、能寫長文、做精美網頁，但實測尚不穩定

智東西先實測了下MiMo的網頁開發能力。

首先，智東西讓其生成了一個電商頁面，需要包含商品主圖輪播、規格選擇、價格、庫存等要素。代碼生成后，MiMo會在右側顯示預覽界面，除查看商品大圖功能需要在完整版使用，其他元素幾乎和真實的線上購物沒有差別。

然后加大難度，智東西讓其生成了一個網頁版迷宮闖關小游戲，需要包含四個難度，能通過鼠標和鍵盤控制。在生成的網頁里，MiMo還增加了提示、積分、計時等功能，整個交互體驗更加完整。

智東西還讓其生成了“圣誕樹裝飾”交互網頁。網頁左側有彩燈、鈴鐺、星星、禮物盒、蝴蝶結，可以拖動這些物品裝飾到右側的圣誕樹上，也可以一鍵清空或者直接生成隨機裝飾。整個畫面會不斷飄落雪花，還可以播放背景音樂。

對于聊天能力，智東西先讓MiMo“用程序員的語氣安慰一只失戀的貓”，MiMo會讓小貓“清理緩存”忘掉不開心的事，還讓小貓“升級硬件”，順便幫小米打了波廣告。

最后智東西讓MiMo生成了一部科幻懸疑題材的AI短劇劇本。一上來，MiMo就給出了深潛記憶提取頭盔、真理之環AI倫理防火墻兩個關鍵要素，通過檢索發現，MiMo在后續劇情中將這兩大物體融入進去，直接作為推動劇情發展的關鍵。

此外，小米在官方博客也放出了不少案例。

首先是網頁生成能力上，其第一個官方案例是“用HTML生成一個漂亮、可用的macOS模擬操作系統”。在最終的生成界面中，包含了基本的macOS風格桌面圖標，還可以切換背景、打開Finder。

其次是，打造“豪華互動圣誕樹”高保真3D網頁應用，并要求視覺效果奢華，MiMo的生成結果能切換圣誕樹和混沌狀態，支持手勢交互等。

第三個演示是用HTML創建交互式太陽系探測器。當用戶點擊每個球體就會出現行星的簡介。

智東西也讓MiMo“用HTML創建一個教育性的交互式太陽系探索器”，不過最后的結果并不如官方演示的質感。其第一次生成時行星無法選擇，重新生成后可選擇行星下面的選項直接不見了。

聊天能力方面，MiMo既能回答“大語言模型擁有知識嗎”這類硬核科普類知識。

MiMo還可以回答“要不要吃長生不老藥丸”，MiMo還會站在人類視角分析要不要吃、可能有哪些條件。

此外，該模型還具備長文本撰寫能力，其可以“寫一個關于誤送信件的憂郁愛情故事”。

MiMo還能寫深刻的非虛構作品，如以一位獨居老人為中心，以他一周內收到的郵件為主，探討現代社會中的孤獨。

二、專為推理、編碼和Agent構建，與K2 Thinking和DeepSeek V3.2 Thinking相當

在數學競賽AIME 2025和科學知識基準GPQA-Diamond中，MiMo-V2-Flash的表現是開源模型中前二。在軟件工程能力的SWE驗證與多語言基準測試中，MiMo-V2-Flash在所有開源模型中位列第一，與全球頂尖閉源模型齊名。

從總的基準測試結果來看，MiMo-V2-Flash在大多數推理基準測試中的性能可與K2 Thinking和DeepSeek V3.2 Thinking相當，同時保持高質量開放式回答的競爭力。

在長上下文評估中，MiMo的模型超過了K2 Thinking。

在Agent任務中，MiMo-V2-Flash在SWE-Bench Verified中超越所有開源競爭對手，性能接近 GPT-5-High。在SWE-Bench多語版本中，MiMo-V2-Flash解決了71.7%的問題。

在搜索Agent評估方面，MiMo-V2-Flash在BrowseComp上得分為45.4，配合上下文管理進一步提升至58.3。

小米已經共享所有推理代碼至SGLang并開源，社區實測單機結果如下：

在Prefill單機吞吐約50000 toks/s的條件下，不同Context Length都取得了優越的TTFT性能。

得益于3層MTP，在16K的Context Length情況下，Decode可以做到單機吞吐5000 ～ 15000 toks/s的同時達到151～115 toks/s的單請求吞吐。

三、引入MTP訓練，后訓練階段提出MOPD

MiMo-V2-Flash的效率提升是因為其為高通量推理設計了創新架構進步。

該模型全局注意力（GA）和滑動窗口注意力（SWA）的1:5混合結構。小米MiMo研究團隊大量的實證結果表明，SWA簡單、高效且易于使用，在通用任務、長上下文負載和推理方面整體表現優于線性注意力。

它還提供固定大小的KV緩存，便于與現有的訓練和推理基礎設施集成。

研究人員重新定義了并行解碼，以實現極高的輸出token吞吐量：通過引入多詞元預測（MTP）訓練，提升了基礎模型的能力，并在推理過程中并行驗證了MTP。

MiMo-V2-Flash利用MTP作為原生草稿模型進行自我推測解碼，實現了實際部署加速。

大語言模型的解碼過程本質上受限于內存，這是由其低運算密度特性決定的。業界通常采用批量級并行技術提升前饋網絡（FFN）的運算密度，但該方法對注意力計算環節并無增益，原因在于每個推理請求都需維護獨立的KV cache。

相比之下，MTP技術通過一次性生成多個草稿token，同步提升了前饋網絡（FFN）與注意力機制的運算密度，后續主模型可對這些草稿token進行并行驗證。這種方案能夠實現token級并行計算，且不會增加KV cache的輸入輸出開銷。

在MiMo-V2-Flash模型中，MTP模塊采用稠密前饋網絡來控制參數量，同時使用滑動窗口注意力機制，從而降低KV cache與注意力計算的成本。

實測數據顯示，3層結構的MTP模塊可達到2.8-3.6個token的有效接受長度，并實現2.0-2.6倍的推理速度提升。

MiMo-V2-Flash預訓練使用FP8混合精度和原生32k序列長度，使用27T token進行訓練。

在后訓練階段，為高效拓展強化學習的計算規模，同時增強模型的推理能力與智能體自主決策能力，研究人員提出了多教師在線策略蒸餾（MOPD）。

該范式先通過監督微調（SFT）或強化學習（RL）技術得到各領域的專家教師模型，再讓學生模型基于自身的策略分布進行采樣，并利用多個教師模型提供的稠密型token級獎勵信號完成優化。

MOPD訓練只需不到傳統SFT+RL流程的1/50計算資源，即可匹配教師模型的峰值表現。

此外，MOPD采用解耦設計，支持新教師與ORM（教學與學習）的靈活整合，自然實現“教學與學習”閉環迭代，精煉學生模式可演變為更強的教師，實現持續自我提升的能力。

結語：小米大模型研發踩下油門

小米憑借混合注意力機制與MOPD等技術創新，大幅優化大模型的研發成本與運行效率；同時開源全部相關成果，有效降低行業研發門檻。此外，近幾個月以來，Xiaomi MiMo大模型團隊踩下油門，發布數篇論文并開源多個模型。

12月5日，小米集團合伙人、總裁盧偉冰透露，公司AI大模型業務過去四個季度投入環比增速超50%，目前進展“已超出董事會預期”，并宣布將AI與“現實世界深度結合”列為未來十年核心戰略。同時，小米正式啟動全球人才招募計劃，單崗位薪酬上限開至千萬元級別，目標“在最短時間內補齊大模型尖端人才缺口”。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

天才少女首秀！MiMo-V2-Flash具備模擬世界能力

每日經濟新聞 2025-12-17 16:07:28
0 跟貼 0
瑞士信息與通信科技公司LogicStar研發代碼智能體，自主修復代碼漏洞 | 瑞士創新100強

鈦媒體APP 2025-12-17 11:14:12
0 跟貼 0

小米突發新模型，主打“極致性價比”，羅福莉：“這只是我們AGI圖線路上的第二步”

華爾街見聞官方 2025-12-17 10:52:23
27 跟貼 27

2800買的小米電視，維修費竟然要2500元，男子：心里別扭極了

阿洪笑說 2025-12-17 18:19:02
13 跟貼 13
95后AI才女羅福莉加入小米，家族驕傲

每日經濟新聞 2025-11-13 22:06:07
13 跟貼 13

雷軍：小米有趣的生態件，很快就會出現在友商的車上了

幽默制造坊 2025-12-17 15:35:26
23 跟貼 23

小米最新消息！從來沒看過這么離譜的結構！維修師傅當場傻眼！

小侯爺 2025-12-16 05:13:14
42 跟貼 42
為什么1.5匹空調價格差異大：小米與格力的價格對比分析

阿晪美食 2025-12-15 18:58:42
5 跟貼 5

走模仿被投訴，小米這回扳回一局

熱點銳評 2025-12-13 09:17:19
11 跟貼 11
雷軍演示小米音響，結果當場翻車，自己不尷尬尷尬的就是別人

笑料小行星 2025-12-17 16:58:08
5 跟貼 5
特斯拉電池有多強，小米都要靠邊站，差距不是一點半點

奇葩趣聞館 2025-12-15 10:55:22
3 跟貼 3
羅福莉一戰封神！小米AI殺上全球頂流

雷科技 2025-12-17 21:07:22
0 跟貼 0
從系統流暢程度看，小米的車機做得最像蘋果的，另一家卡要命

木子笑場 2025-12-16 15:42:50
374 跟貼 374
雷軍談小米一體化電池技術，Ultra同款防彈涂層，底盤直接干沒了

笑料大工廠 2025-12-15 14:27:32
98 跟貼 98
夸克、小米、Meta三款AI眼鏡上手對比

智東西 2025-12-01 15:48:13
0 跟貼 0
小米輔助駕駛追上華為了嗎

Autolab 2025-12-13 14:33:23
0 跟貼 0
雷軍：買小米YU7送雷神之錘，女生敲兩三下也能敲穿玻璃

生活玩笑社 2025-12-16 13:58:39
1 跟貼 1
車商定小米到手就虧錢，這家車企，把二道販子治的服服帖帖！

流年愛生活 2025-12-14 17:20:39
18 跟貼 18
180天造的車，幾十萬賣給消費者，連小米都不敢這么狠！

萌界生活看看 2025-12-15 16:19:39
125 跟貼 125
小米建立汽車智能互聯生態比亞迪廣豐已接入生態接口

梨視頻 2025-12-17 16:33:34
1 跟貼 1
貼牌生產的小米家電，剛買的洗衣機就有銹跡，沒想到換一臺還這樣

領笑之家 2025-12-17 19:54:35
2 跟貼 2
小米又憋大招了！

優視汽車 2025-12-17 16:44:57
0 跟貼 0
學校“勵志計劃”走進小米汽車工廠開展實踐研學活動

北科大青年 2025-12-17 19:46:42
0 跟貼 0
小米前備箱裝水測試，結果萬萬沒想到，雷軍拯救了中國汽車！

蝴蝶愛搞笑 2025-12-14 14:17:33
11 跟貼 11
小米總裁：小米汽車CarloT生態 30余種品類全面開放

梨視頻 2025-12-17 16:33:39
0 跟貼 0
雷軍56歲生日小米高管、網友集體送祝福

梨視頻 2025-12-17 16:33:28
0 跟貼 0
雷軍千萬挖角的天才少女，她根本就不是天才

雷科技 2025-11-12 21:45:22
0 跟貼 0
雷軍：小米所有硬件毛利潤不超過5%，只為了交個朋友

星夜書搞笑 2025-12-14 13:42:38
239 跟貼 239
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
7 跟貼 7
雷軍這個優點被忽視了？

DannyData小丹尼 2025-12-15 18:01:01
7 跟貼 7
告別手搓Prompt，前美團高管創業，要讓物理世界直接成為AI提示詞

機器之心Pro 2025-12-16 10:40:13
4 跟貼 4
23萬買小米試駕車，提完車查出事故，基本上屁股都沒掉了

聊明搞笑 2025-12-16 10:54:22
1 跟貼 1
才過去4天，雷總再次被現實打臉，網友：低速防碰撞只是設計目標

大齊聊笑 2025-12-17 21:25:36
4 跟貼 4
突發！小米平板全系“反向漲價”，最高暴漲20%？別等了，這波“存儲刺客”才剛剛開始

科技數碼阿偉 2025-12-16 02:54:40
0 跟貼 0
英偉達CEO黃仁勛：我想買一輛小米汽車

每日經濟新聞 2025-07-16 17:52:55
0 跟貼 0
AI研發本質是一場與生物進化同構的試錯游戲

量子位 2025-12-12 04:34:17
0 跟貼 0
理想AI眼鏡Livis，小米車主也想買

愛范兒 2025-12-04 23:06:50
0 跟貼 0
小米YU7準新車跌破發售價此前溢價曾達1萬元

梨視頻 2025-12-17 16:37:24
1 跟貼 1
小米金融旗下一融資擔保公司更名為信息科技公司

界面新聞 2025-12-17 11:13:47
2 跟貼 2
獨居女子去世遺產被收歸國有遠親想幫買墓安葬遇難題

大象新聞 2025-12-17 12:41:03
16677 跟貼 16677

智東西

聚焦智能變革，服務產業升級。

10926文章數 116928關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

房產

旅游

本地

教育

手機 / 數碼

房產 / 家居

羅福莉首秀前，小米突然發布！代碼全球最強，總體媲美DeepSeek-V3.2【附實測】

特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

墜亡女教師有已婚哥哥和未婚弟弟 父母被指不愿退彩禮

墜亡女教師有已婚哥哥和未婚弟弟 父母被指不愿退彩禮

短短一年，從爭冠到0勝墊底...

狗仔曝熱播劇姐弟戀真談了？？？

重磅信號！收入分配制度或迎重大突破

一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

態度原創

你算老幾？我算老己！

封關前夕！豪庭銘苑超前交付，敬呈海口生活新范本

云游安徽｜踏過戰壕與石板，讀一部活的淮北史

高三一輪復習，別太聰明，踏實一點

墜亡女教師有已婚哥哥和未婚弟弟父母被指不愿退彩禮

墜亡女教師有已婚哥哥和未婚弟弟父母被指不愿退彩禮

一車多動力+雙姿態長城歐拉5上市限時9.18萬元起