![]()
2025年小米人車家全生態合作伙伴大會上,一個名字和一款模型同時引爆AI圈。被傳“雷軍花千萬年薪挖來”的AI大牛羅福莉,首次以小米MiMo大模型負責人的身份公開亮相,帶來了小米新一代自研大語言模型MiMo-V2-Flash——不僅性能對標頂尖開源模型,還以“3090億總參數+150億活躍參數”的MoE架構實現極致效率,更關鍵的是,它剛發布就全線開源。
![]()
在大模型賽道還在比拼“參數越大越厲害”的當下,小米反其道而行之,用“跑得快、跑得久、被高頻調用也跑得起”的設計理念,給行業澆了一盆清醒劑。這款模型背后,既有羅福莉團隊的技術取舍,更藏著小米對AGI(通用人工智能)的獨特思考:智能不是“讀”出來的,而是“活”出來的。
一、幕后推手:從頂會學霸到小米AI掌舵人
要理解MiMo-V2-Flash的創新邏輯,先得認識它的“操盤手”羅福莉。這位北大計算機碩士出身的技術大牛,學生時代就創下“一次性在國際頂會ACL中標8篇論文”的紀錄,其中2篇以第一作者身份發表,一度沖上知乎熱搜,成為AI圈公認的“潛力股”。
![]()
畢業后,羅福莉先后加盟阿里巴巴達摩院、DeepSeek母公司幻方量化,在幻方期間深度參與了DeepSeek-V2等爆款模型的研發,積累了從基礎研究到工程落地的全鏈條經驗。2025年11月,她正式官宣加入小米,這次大會是她入職后的首次公開演講。
![]()
盡管略顯緊張,但羅福莉條理清晰地傳遞了核心觀點:“大模型解碼了人類思維的文本投影,卻沒真正理解物理世界”。正是這種清醒的認知,讓MiMo-V2-Flash跳出了“參數競賽”的怪圈,走上了“實用主義”的道路。
二、技術拆解:為什么它能“又快又便宜”?
普通人可能看不懂“3090億總參數”“150億活躍參數”的差距,但只要記住一個核心:MiMo-V2-Flash用更小的“運行成本”,實現了和頂尖模型相當的性能。這背后是兩大關鍵技術的支撐:
1.MoE架構:只“點亮”需要的部分
MiMo-V2-Flash采用了當下最先進但工程難度極高的MoE(混合專家)架構。簡單說,這個模型就像一個“專家團隊”,總共有3090億個“專家”(參數),但處理任務時,只需要150億個“相關專家”上陣,其他專家可以“休息”。
這種設計的好處顯而易見:既保留了大模型的綜合能力,又大大降低了推理時的算力消耗。打個比方,這就像請了一支全能樂隊,但演出時只需要根據歌曲風格,安排對應的樂手上場,既保證了演出質量,又節省了場地和設備成本。
2.MTP技術:讓輸出速度“翻倍”
如果說MoE架構解決了“輕量化”問題,那么MTP(多詞元預測)技術就解決了“速度”問題。羅福莉團隊在預訓練和微調階段都加入了MTP層,推理時更是采用三層MTP并行推理,讓模型輸出速度直接提升2-2.6倍。
![]()
根據社區測試數據,MiMo-V2-Flash在單機環境下,每秒能處理5000-15000個token(相當于2-7.5萬字),單請求輸出速度也能達到150token/s(約75字/秒)。對比來看,它的推理速度是DeepSeek-V3.2的3倍左右,而成本卻更低;和綜合能力相近的Gemini2.5Pro相比,成本直接低了20倍。
除此之外,小米還創新了HybridAttention(混合注意力)結構和MOPD(多教師在線蒸餾)范式,前者兼顧了長短文本處理能力和推理效率,后者則讓模型在強化學習階段快速吸收多個“專家模型”的優點,用更少的算力實現能力升級。
三、實測實力:在核心賽道沖進“第一梯隊”
光有技術創新還不夠,模型好不好用,得用數據說話。小米官方公布了MiMo-V2-Flash在7項主流評測中的成績,對手包括開源的DeepSeek-V3.2、K2-Thinking,以及閉源的ClaudeSonnet4.5、GPT-5(High)等頂尖模型。
結果顯示,MiMo-V2-Flash在Agent(智能體)、代碼、工具調用、復雜任務執行這四大核心場景中,已經躋身全球第一梯隊。尤其在權威的SWE-Bench軟件工程測試中,它以71.7%的準確率拿下多語言模式第一,證明了其在實際工業場景中的實用價值。
![]()
對于開發者和企業來說,這意味著什么?以前需要高昂成本才能接入的頂尖模型能力,現在通過開源的MiMo-V2-Flash就能免費獲得。無論是WebCoding、IDE工具集成,還是智能終端的Agent交互,都能以極低的成本實現高效部署。
![]()
四、行業啟示:開源+實用,小米的AGI路線圖
羅福莉在演講中反復強調:“這只是我們在AGI路線圖上的第二步”。這句話的背后,是小米對AI未來的清晰判斷:
首先,大模型的競爭已經從“預訓練規模”轉向“后訓練效率”。隨著Agent場景的普及,模型需要持續通過強化學習迭代升級,穩定、可擴展的訓練體系比單純的參數規模更重要。
其次,開源是縮短技術差距的關鍵。在羅福莉看來,開源不只是共享代碼和權重,更是一種“分布式技術加速機制”。通過開源,小米能匯聚全球開發者的力量,共同優化模型,讓AGI更快走向普惠。
最后,下一代智能體必須“落地現實”。當前大模型之所以會出現“具身幻覺”,比如不懂重力、不理解時空關系,核心是因為它們只從文本中學習,沒有真正和物理世界交互。羅福莉認為,未來的智能體需要構建“統一的世界模型”,從“回答問題”轉向“完成任務”,從“文本模擬”走向“實體交互”。
結語:效率革命背后的AI新方向
MiMo-V2-Flash的發布,不僅是小米在AI賽道的一次重要突破,更給整個行業帶來了新的思考:大模型的終極目標不是“更聰明”,而是“更好用”。當其他廠商還在比拼參數規模時,小米已經用工程優化實現了“性價比拉滿”的效果,這或許就是未來大模型的核心競爭力。
隨著開源生態的完善和Agent場景的普及,MiMo-V2-Flash可能會成為更多開發者和企業的首選基座模型。而羅福莉提出的“智能要在交互中活出來”的理念,也預示著AI行業將從“文本大模型”時代,逐步邁向“具身智能”時代。
對于普通人來說,這意味著未來的智能設備會更懂需求、響應更快、使用成本更低——或許不久后,我們在小米手機、智能眼鏡、汽車里感受到的AI交互,都將源自這個“跑得快、用得起”的大模型。而這,只是小米AGI路線圖的第二步,更精彩的還在后面。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.