![]()
文:趙明
編輯:周易
「我相信,真正的智能絕對不是在文本中讀出來的,而是在交互中活出來的」。
2025 年 12 月 17 日,在今年度的小米「人車家全生態」合作伙伴大會上,小米宣布自研 AI 大模型 Xiaomi MiMo-V2-Flash 正式開源上線——而 Xiaomi MiMo 大模型負責人羅福莉也首次正式亮相,談到了她對于 AI 的理解。
在演講中,羅福莉多次表達了「物理世界導向」對于 AGI 實現的重要性。
![]()
她表示,多模態和真實世界交互才是通往 AGI 的關鍵,而非依靠文本。在她現場展示的 PPT 中,小米剛剛開源的大模型 Xiaomi MiMo-V2-Flash 也就此做出解讀:真正的智能必須是一個具身的、嵌入環境的、通過與物理世界持續交互而涌現的屬性。
某種程度上,羅福莉的這次演講,代表了小米對于大模型和 AGI 的思考,以及小米在 AI 道路上的核心理念:與數字世界 AI 相比,更加強調物理世界的 AI 重要性。
很明顯,以羅福莉的入職和亮相為代表,小米確實正在 AI 人才和大模型領域加大投入,而 AI 本身也是小米整體技術研發投入的三大核心板塊之一。
那么,小米 AI 這一波,到底行不行?
95 后羅福莉,首次交卷了
從外界的視角來看,2025 小米「人車家全生態」合作伙伴大會的最大看點,其實是小米 MiMo 大模型負責人羅福莉的演講。
這要從羅福莉本人在 AI 領域的關注度說起。
公開數據顯示,羅福莉是一名 95 后,她本科畢業于北京師范大學,碩士畢業于北京大學計算語言學研究所,師從萬小軍教授。羅福莉在北京大學攻讀碩士期間,就曾經在人工智能領域頂級國際會議 ACL 上發表 8 篇論文,其碩士期間在國際級會議上累計發表論文超過 20 篇。
從職業生涯來看,羅福莉畢業后加入阿里達摩院,擔任機器智能實驗室研究員,主導開發多語言預訓練模型 VECO,并推動了 AliceMind 項目的開源工作。隨后在 2022 年,羅福莉加入 DeepSeek 母公司幻方量化,并且以深度學習研究員的角色參與研發 DeepSeek-V2 等模型。
而在 DeepSeek 的經歷,成為了羅福莉備受關注的核心支點。
2024 年 12 月,第一財經新皮層報道,DeepSeek-V2 的關鍵開發者之一羅福莉將加入小米——根據知情人士的說法,雷軍認為小米在大模型領域發力太晚,于是親自挖人,重金招募能夠領軍小米大模型的人才,支付的薪酬水平在千萬元級別。
在當時的輿論場中,,類似于「雷軍千萬年薪挖角 95 后 AI 天才少女」這樣的詞條也登上熱搜。
不過,一直到 2025 年 11 月 12 日,羅福莉才通過社交媒體對外確認,自己正在 Xiaomi Mimo 團隊做 AGI 相關工作——此番在小米「人車家全生態」合作伙伴大會登臺,也是羅福莉在小米的第一次公開亮相。
在會上,羅福莉主要介紹了 Xiaomi MiMo-V2-Flash 大模型的一些內容。
![]()
她表示,Xiaomi MiMo-V2-Flash 是一個非常小的模型,總參數只有 309B,激活參數只有 15B,但它在多數評測中超過了參數量更大的 DeepSeek V3.2 和 K2-Thinking,在全球大致處于相同水位的頂尖模型速度和成本象限里,MiMo-V2-Flash 實現了低成本、高速度,已初步具備模擬世界的能力。
其中,在技術層面,MiMo-V2-Flash 采用 3 層 MTP 推理加速并行 Token 驗證,實現了 2.0-2.6 倍的推理速度提升。這種效率優勢對于實際應用場景至關重要,特別是在資源受限的邊緣設備上。
「我都不愿意稱它是一個非常大的模型,但是它的代碼能力,在我來看它已經進入了全球 top 2」,羅福莉表示。
值得一提的是,Xiaomi MiMo-V2-Flash 已經正式開源,采用了對開發者友好的 MIT 開源協議,基礎版權重已經在 Hugging Face 上發布,支持深度思考和聯網搜索功能。
關于 Xiaomi MiMo-V2-Flash ,盧偉冰表示,它是邁向 Agent 時代的全新語言基座。
不過,從商業的角度來看,MiMo-V2-Flash 作為 小米 MIMo 大模型家族的最新成果,其本質上也是為了小米的「人車家全生態」而服務。
實際上,羅福莉也表示,通過統一多模態感知能力,MiMo 能夠為理解物理世界打下基礎,從而更好地嵌入各種智能終端設備。這包括智能手機、智能汽車、智能家居設備等,形成一個無縫銜接的智能生態系統。
換句話說,MiMo 大模型將成為小米用來連接「人車家」三端的「智能大腦」。
大模型之路,已悄然轉折
小米入局大模型的時間,其實非常早。
早在 2023 年 8 月,在雷軍的年度演講中,這位小米掌門人就表示,小米全面擁抱大模型,并且在 2023 年 4 月組建小米了 AI 大模型團隊——據了解,該團隊的負責人是小米技術委員會 AI 實驗室大模型團隊負責人欒劍。
當時,雷軍表示,小米大模型技術的主力突破方向是「輕量化」和「本地部署」;他還表示,小米自研的 13 億參數端側模型已經在手機端跑通了 Demo,而且部分場景效果可以媲美 60 億模型在云端的運算效果。
值得一提的是,在這次演講之前,小米公司開發的大規模預訓練語言模型 MiLM-6B/1.3B 就登陸了代碼托管平臺 GitHub,參數規模最高達 64 億,而且現身在 C-Eval、CMMLU 基準評測榜單。
可以說,MiLM 在很長一段時間里都是小米大模型的代名詞。
2024 年 5 月,小米公司宣布其大語言模型 MiLM 已正式通過大模型備案。當時,小米官方強調,小米大模型將逐步應用于小米汽車、手機、智能家居等產品中,為用戶帶來更加智能化的體驗。
![]()
到 2024 年 11 月,小米宣布 MiLM 升級至二代 MiLM2,豐富了模型的參數矩陣,參數規模同時向下和向上擴充,實現了云邊端結合,參數尺寸最小為 0.3B,最大為 30B,其中 MiLM2-30B 模型專門為云端設計;同時,新模型在指令跟隨、翻譯和閑聊等一系列能力上平均提升超 45%……
當時,小米官方也表示,小米第二代自研大模型取得的進步和成果,已經開始滲透到真實的業務場景與用戶需求中,不僅幫助集團內部解決了多樣化的業務需求、實現工作提效,也已經在澎湃 OS、小愛同學、智能座艙、智能客服中開始應用落地。
不過,也正是在這個時間節點,小米的大模型之路,開始進入轉折點。
實際上,據第一財經「新皮層」報道,正是在 2024 年年底,雷軍挖來了羅福莉。以羅福莉的正式入職為節點,小米自研大模型的重心開始逐步切換,而小米則在 2025 年年初組建了「大模型 Core」團隊,并且在 4 月份發布了小米 MiMo 系列的首個模型,也就是 MiMo-7B。
實際上,在此次發布 Xiaomi MiMo-V2-Flash 之前,小米就已經以 MiMo 的名義推出了一系列模型,包括推理大模型 MiMo-7B、視覺推理大模型 MiMo-VL、原生端到端音頻生成模型 MiMo-Audio、端側視覺語言大模型 MiMo-VL-Miloco、具身大模型 MiMo-Embodied。
對此,一位長期關注小米的 AI 行業人士告訴我們,小米在大模型領域的核心支點,已經從以往的以往的 MiLM 悄然轉向為如今的 MiMo。
那么,小米 MiMo 下一步會如何發展?
對此,羅福莉其實也已經表態——她表示,下一代基座模型將會重點關注模型參數規模的增大與上下文長度的擴展;模型將是原生多模態的,意味著要用文本、視覺、音頻原生融合的統一架構實現端到端的物理世界感知與推理。另外,算法與底層硬件相結合,提升訓練與推理效率。
可見,小米 MiMo 不僅僅是要解決數字 AI 的問題,也要在很大程度上解決物理 AI 領域的難題,這確實是一個不小的目標。
加碼補課技術,但依舊務實
小米對于 AI 和大模型的態度轉變,本質上是伴隨著其業務發展而產生的。
比如,2023 年上半年,隨著 ChatGPT 的橫空出世,國內掀起了一波大模型競賽,當時小米表示不會做 OpenAI 類的大模型,但會積極擁抱 AI,將其與自身業務深度結合。這背后的背景是,小米當時還是把 AI 落地的重點場景考慮在智能手機上。
但如今,隨著小米汽車業務的迅猛發展和小米「人車家全生態」的逐步成熟,小米對于 AI 落地場景的理解更加全面,對于大模型的重要性有了不一樣的感知。
這才是小米通過自研 MiMO 持續加碼 AI 的核心邏輯。
不過,即使是大模型,小米投入到 AI 大模型的邏輯,與騰訊、阿里、字節等互聯網巨頭在 AI 領域的布局,還是有著明顯的不同。
畢竟,小米不是一家純粹的軟件公司或互聯網公司,它本質上是全球最大的消費電子物聯網公司之一。根據小米公布的數據,小米全球月活用戶數達到 7.42 億;硬件生態方面,小米 AIoT 平臺連接設備數達到 10.4 億,硬件合作伙伴數量突破 15000 家。
所以,小米 MiMo 大模型的終極落地場景,就是在萬物互聯的端側設備上,包括手機,也包括汽車。
基于此,我們也能夠理解,MiMo-V2-Flash 模型的特質在于,它是一款端云結合、側重端側的輕量化大模型;它的核心邏輯是端側優先,其目的把一個更小參數量的模型,通過極致的蒸餾和量化,實現本地化部署,直接塞進小米手機或者小米汽車的車機里。
這在本質上,也是 MiMo-V2-Flash 的命名包含有「Flash」字樣的關鍵原因。
從這個角度來看,小米對于大模型的思考和業務發展邏輯其實也非常明晰——那就是在加大力度投入到大模型同時,依舊非常務實,更加側重于自身的業務落地場景,更加強調軟硬件結合的核心產品邏輯。
值得一提的是,考慮到小米的「人車家」全生態,尤其是車端本身也是 AI 落地的核心場景之一,所以,小米對于大模型的思考,更加側重于對于物理世界的感知和交互,也就是讓大模型超脫數字世界的范疇,與物理世界更好地融合。
所以,小米做大模型的底層出發點,也天然地與具身智能產生了密切關聯,這是小米做大模型最有挑戰的地方——但是從另外一個角度來看,也是最有潛力的地方。
回過頭來看,小米花重金投入到大模型,本質上也是在補課——補上大模型的課,也是補上研發投入到核心科技的課。尤其是在 AI 技術進入到無人區和深水區之后,這樣的研發投入對于當前的小米來說,確實是非常必要的。
當然,小米不僅僅是在花大力氣投入到 AI 之中,也在砸錢投入到芯片和操作系統的研發中,包括此前的玄戒 O1 芯片和小米 Vela 等,以及這次開源的 Xiaomi MiMo-V2-Flash,也是這些研發過程的階段性成果。
但很明顯,還不夠。
值得注意的是,就在本次小米「人車家全生態」合作伙伴大會上,小米集團合伙人、總裁盧偉冰又再次強調稱,小米今年預計研發投入達到 320 億元到 330 億元,2026 年預計投入約 400 億,未來五年小米將在研發上投入 2000 億元。
他還強調:「小米的長期目標是成為全球硬核科技的引領者」。
![]()
不過,從資本市場的角度來看,小米在 12 月 17 日的股價并沒有因為其對外釋放的研發成果而出現明顯的回升,甚至在此后兩天還出現了一定的下行——從資本市場的反饋來看,至少到目前為止,外界對于小米加碼硬核科技、加碼研發投入的敘事邏輯還并不買單。
很明顯,盡管小米在 AI、芯片等領域已經拿出了一些成果,小米距離一家真正意義上的硬核科技公司,還有相當長的距離。
畢竟,對于任何一家企業來說,從技術研發到產品落地,再到最終市場認可,這從來都是一條漫長且充滿不確定性的過程——要在 AI 落地上實現這個階段性過程,小米除了繼續投入大量的金錢和時間之外,還需要更強大的戰略定力。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.