小米MiMo團隊中,每天Agent對話次數少于100次的,就離職吧。
前腳,小米MiMo-V2-Pro模型剛登上OpenRouter調用量榜單第一。
后腳,羅福莉就發文分享了自己對于團隊管理的思考。
熱度幾乎無縫銜接,網友們的目光也紛紛從模型本身轉到小米MiMo團隊身上。
![]()
滿打滿算,從發布首個推理大模型MiMo-7B到現在不到的一年時間,MiMo的能力曲線卻呈現出明顯陡升——
短短時間內已沖到全球一線梯隊。
![]()
相比之下,同樣花重金組建的Meta超級智能實驗室,近期卻頻頻跳票,被爆模型性能遠不如早前發布的前沿模型。
于是,不少人開始好奇:
小米MiMo,究竟是一支怎樣的團隊,竟能在幾個月時間打造出讓全球關注的模型?
![]()
眾所周知,大模型開發向來是集團軍作戰,model card的背后往往是多位作者的集體智慧。
而且據內部消息透露,小米的LLM團隊在內部也相當神秘,但通過整理近半年的模型發布記錄和論文,仍能捕捉到一些蛛絲馬跡——
核心作者大多來自北京大學,其中甚至還有羅福莉本人的師弟。
更值得注意的是,北京大學也是羅福莉的老東家DeepSeek的策源地。
關于小米MiMo團隊
小米MiMo團隊近期的動作引發了外界廣泛好奇,而這種關注與團隊在產品側和論文發表的「高節奏推進」密不可分。
隨著多篇研究成果陸續曝光,小米MiMo團隊核心成員也浮出水面。
![]()
MiMo-7B技術報告核心貢獻者
肖邦駿(Bangjun Xiao),MiMo-V2-Flash 的首作,本科及博士均就讀于北京大學。
![]()
博士生導師為北京大學人工智能研究院副院長黃罡教授。
他的研究方向聚焦于邊緣計算和聯邦學習,之前也短暫涉獵過計算機視覺和擴散模型。
Bingquan Xia,MiMo-V2-Flash 核心作者之一,中科院計算技術研究所2021屆研究生。
![]()
馬文晗(Wenhan Ma),自2025年9月起在北京大學計算機科學學院攻讀博士,由穗志方教授指導。
![]()
△公眾號:大信科
他的研究方向為大語言模型,近期主要關注提升大語言模型的推理能力。
本科畢業于北京大學電子工程與計算機科學學院,專業為計算機科學與技術。
值得一提的是,穗志方教授正是羅福莉在北大的導師,而馬文晗則是羅的同門師弟。
![]()
△公眾號「北京大學」羅福莉(后排左二)與導師穗志方教授(前排右二)合影
朱大為(Dawei Zhu),北京大學三年級博士生,導師為李素建教授,本科畢業于北京大學電子工程與計算機科學學院。
![]()
研究方向為長上下文建模,他認為高效處理超長上下文是未來語言模型和多模態模型的關鍵能力,也對智能體(Agent)、對齊(Alignment)以及多模態模型的進展感興趣。
此前,他參與的《paperbanana》項目曾引起較大關注,并被量子位關注。
![]()
董謹豪,中國人民大學信息學院/數據工程與知識工程教育部重點實驗室講師,同時也是小米大語言模型(LLM)核心團隊技術顧問,主要負責與代碼相關的LLM開發,包括預訓練、強化學習及智能體方向。
![]()
他主導建立了人大發–小米基礎大語言模型聯合重點實驗室,并擔任技術委員會成員。
他博士畢業于北京大學計算機科學學院,本科畢業于西安電子科技大學計算機科學與技術專業。
張海林,小米MiMo團隊成員,專注于AI基礎設施建設,為MiMo系列模型打造高效、可擴展且穩定的強化學習(RL)基礎設施。
![]()
他2025年獲得北京大學計算機科學博士學位,導師為崔斌教授,并曾獲北京大學優秀博士論文獎。
研究重點包括大規模大語言模型(LLMs)、深度學習推薦模型(DLRMs)、信息檢索(IR)及通用分布式計算。
此外,還有諸多核心作者,但公開信息較少,部分谷歌主頁如下:![]()
![]()
小米MiMo是一支怎樣的團隊
一支成立才一兩年的團隊,能一路沖到頂尖模型研發的前列,靠的絕不只是產品節奏和核心成員這么簡單。
仔細梳理團隊的背景,我們也會發現一個明顯的共性——北大背景濃厚。
從核心成員到技術骨干,很多團隊成員本科或博士均來自北京大學計算機學院。
一方面,北大的同門關系、導師體系和院系傳承,使得小米在大模型工業界作為后起之秀,能夠源源不斷地吸納新鮮血液;
另一方面,學生們也能迅速接觸工業界,借助豐富的算力和資源,將科研想法高效落地與迭代。
而在這個過程中,羅福莉則成為團隊與北大學術背景之間的重要橋梁。
![]()
圖源:北京大學公眾號
除了院校對于成員產品理念的影響外,小米MiMo團隊的技術理念也深受小米企業產品基因的驅動——
核心就是產品層面的「性價比」和公司一貫的「互聯網生態」思維。
放到MiMo模型上,最直觀的體現就是7B參數規模、開源策略以及端側部署方向,也算是清楚地展現了小米的戰略布局和生態思路。
所以回過頭看,MiMo的成功并非偶然,而是多重因素疊加的結果:
北大科研背景的厚度、核心成員的技術經驗,以及小米產品與工程的基因驅動,共同鑄就了這支年輕團隊的迅速崛起。
對了,還有一個頗有緣分的小細節值得一提——
不久前從阿里離職的通義實驗室Qwen大模型負責人林俊旸,正是羅福莉的師兄。
兩人碩士階段均在北京大學語從事自然語言處理相關學習研究,學術路徑高度同源。
畢業后又先后加入阿里達摩院,在大模型研發上有著相近的技術底色與行業視野。
一個曾做Qwen,一個帶MiMo。
兩條國內頭部模型線的關鍵人物,曾經在同一套學術和產業體系中成長出來,這層關系本身也讓不少業內人多看了一眼。
參考鏈接:
[1]https://arxiv.org/pdf/2505.07608
[2]https://github.com/CuteNPC
文章來源:量子位。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.