昨夜,小米毫無預兆地開源其最新大模型 MiMo-V2-Flash,瞬間引爆全球AI圈。這款總參數高達3090億、實際激活僅150億的稀疏架構巨獸,以每秒150個token的推理速度和百萬token輸入僅0.1美元的白菜價,直接將國產大模型性能與性價比拉至新高度,令一眾閉源巨頭措手不及。
![]()
據公開測試數據,MiMo-V2-Flash在AIME 2025數學競賽與GPQA科學問答等高難度基準中穩居開源模型前二,其SWE-bench Verified代碼修復成功率高達73.4%,力壓所有開源對手。更驚人的是,在多項通用能力評測中,該模型已能與DeepSeek-V3.2正面掰腕,甚至在多語言編程與復雜數學推理上略勝一籌,被業內視為“最接近GPT-5水平的開源模型”。
速度與成本的雙重碾壓,才是MiMo-V2-Flash真正的殺手锏。用戶實測反饋“問題剛發出,答案已刷屏”,延遲低至毫秒級;而其API定價僅為同類閉源模型的十分之一,真正實現“智能平權”。背后支撐這一切的,是小米自研的混合專家(MoE)架構與創新的5:1混合注意力機制——既支持256K超長上下文,又大幅降低顯存占用,連RTX 3060等消費級顯卡都能流暢運行。
![]()
更值得警惕的是,該模型并非純云端玩具。它專為端側部署優化,未來有望深度集成進澎湃OS,賦能小愛同學與米家生態,實現“本地化智能+隱私保護+實時響應”的三位一體體驗。目前,小米已上線網頁版MiMo Studio,開放聯網搜索與設備控制功能,邁出“AI進入物理世界”的關鍵一步。
技術突破的背后,是小米AI團隊的高效攻堅。據悉,項目由前DeepSeek核心研究員領銜,采用名為MOPD的新型蒸餾訓練范式,以不到傳統流程1/50的算力成本逼近頂尖性能。盡管有聲音指出其在特定領域代碼生成穩定性仍有波動,且尚未支持多模態,但瑕不掩瑜。
小米此次出手,顯然不止于技術秀肌肉。通過MIT協議全面開源模型權重與推理代碼,并提供限時免費API,小米正試圖以“高性能+低成本+全開源”組合拳,撬動開發者生態,為其“人車家全場景智能”戰略鋪路。
![]()
(免責聲明:本文基于公開網絡信息整理,部分性能數據來自非官方測試,實際體驗可能因環境差異而不同。模型能力仍在快速迭代中,不構成投資或技術采納建議。)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.