【CNMO科技消息】12月16日,CNMO注意到,小米MiMo官方宣布:MiMo-V2-Flash的總參數為309B,活躍參數為15B。
![]()
在架構設計上,小米MiMo-V2-Flash采用了混合注意力機制。其混合模塊設計包含8個混合塊,其中每5個滑動窗口注意力(SWA)層對應1個全局注意力層。在上下文支持能力上,該模型原生支持32K的訓練,并且能夠擴展到256K的上下文支持。
從性能表現來看,小米MiMo-V2-Flash在通用基準測試中,與DeepSeek-V3.2不相上下,同時延遲大幅降低。在SWE-Bench驗證和多語言集中分別取得了73.4%和71.7%的成績。尤為突出的是其速度優勢,在Day-0時,輸出速度高達每秒150個token,這一速度在同類模型中處于領先地位。
![]()
為了直觀展示其性能,小米MiMo官方還公布了一系列對比圖表。在與DeepSeek-V3.2、K2-Thinking、Claude Sonnet 4.5、GPT-5(High)、Gemini 3.0 Pro等模型的對比中,MiMo-V2-Flash在多個測試項目上都展現出了極具競爭力的表現,部分指標甚至領先于其他模型。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.