<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      小米突發新模型,主打“極致性價比”,羅福莉:“這只是我們AGI圖線路上的第二步”

      0
      分享至

      11個小時前,小米深夜“突襲式”發布并開源了其最新的專家混合架構(MoE)大語言模型MiMo-V2-Flash。該模型總參數量達3090億,活躍參數為150億,采用對開發者友好的MIT開源協議,基礎版權重也已經在Hugging Face上發布。


      小米MiMo團隊負責人羅福莉(Fuli Luo)在社交平臺上明確表示:“MiMo-V2-Flash已經上線。這只是我們AGI路線圖上的第二步。”這一表態凸顯了小米在AI領域的長遠規劃和技術雄心。


      從市場影響來看,MiMo-V2-Flash的入局可能攪動現有開源AI模型的競爭格局。其官方公布的每百萬輸入token 0.1美元、輸出token 0.3美元的極低成本,結合高達150 tokens/秒的推理速度,為開發者和企業提供了極具吸引力的選擇,或將加速高性能AI技術在更廣泛場景的應用和普及,尤其是對其龐大的“手機 x AIoT”生態系統形成強大賦能。


      性能媲美DeepSeek-V3.2,并且“極具性價比”

      MiMo-V2-Flash在多個權威基準測試中展現了強大的實力,其性能表現足以和部分頂尖的開源及閉源模型同臺競技。

      根據小米官方公布的數據,在衡量編程能力的SWE-bench Verified測試中,MiMo-V2-Flash取得了73.4%的得分,超越了所有已知的開源模型,并接近頂級閉源模型的水平。

      在AIME 2025數學競賽和GPQA-Diamond科學知識測試等考驗推理能力的項目中,該模型也位列開源模型前兩名。摩根士丹利的研報圖表亦顯示,MiMo-V2-Flash在綜合性能上與DeepSeek-V3.2等主流大模型相比具有競爭力。



      在愈發重要的智能體(Agent)任務上,MiMo-V2-Flash同樣表現出色。數據顯示,其在τ2-Bench分類得分中,通信、零售、航空等多個類別均獲得高分,證明其具備理解復雜任務邏輯和執行多輪交互的能力。

      小米方面表態現實,該模型的高性能與150 tokens/秒的推理速度,加上極低的運營成本,使其成為現有最高性價比的高性能模型之一。目前,該模型已在API平臺限時免費開放,并以MIT開源協議在Hugging Face上發布了基礎版權重。


      “極致性價比”背后的技術創新:解鎖效率與長文本能力

      MiMo-V2-Flash之所以能在保持高性能的同時實現低成本和高效率,得益于其在模型架構和訓練方法上的多項關鍵技術創新。

      首先,是“混合滑動窗口注意力機制”(Hybrid Sliding Window Attention)。小米采用了一種5:1的混合比例,即每5層滑動窗口注意力(SWA)搭配1層全局注意力,將KV緩存(一種用于存儲中間結果的內存)的存儲量減少了近6倍,同時依然支持高達256k的超長上下文窗口。

      羅福莉(Fuli Luo)在其X帖子中分享了工程細節:“我們最終選擇了混合SWA。它簡單、優雅,并且在我們的內部基準測試中,其長上下文推理能力優于其他線性注意力變體。”她特別指出一個反直覺的發現,即128個token的窗口大小是“最佳選擇”,盲目擴大到512反而會導致性能下降,并強調“sink values是不可或缺的”。


      其次,是輕量級多Token預測(Lightweight Multi-Token Prediction, MTP)。該技術使模型能一次并行預測多個token,而非傳統的逐字生成,從而將推理速度提升2至2.6倍。

      羅福莉透露:“通過3層MTP,我們觀察到平均接受token數超過3個,編碼任務速度提升約2.5倍。”她補充說,這項技術有效解決了GPU的空閑時間問題,盡管因項目周期緊張此次未能完全整合進強化學習(RL)循環,但小米已將3層MTP開源,供開發者使用。

      今年11月,曾效力DeepSeek的羅福莉在X上高調宣布正式加入小米,出任MiMo團隊負責人。小米MiMo是小米推進大模型研發的核心招牌,隨著羅福莉的官宣,小米MiMo也被一并明確,劍指最前沿——空間智能。


      訓練“黑科技”:1/50算力實現性能對齊

      在訓練階段,小米采用了業界領先的技術以最大化效率。模型在預訓練階段使用了FP8混合精度技術,在27萬億token的數據上完成訓練。

      更具突破性的是在后訓練階段引入的多教師在線策略蒸餾(Multi-teacher Online Policy Distillation, MOPD)框架。據小米介紹,該方法借鑒了Thinking Machine的On-Policy Distillation思路,讓學生模型在訓練時能從多個專家教師模型處獲得密集的獎勵信號。其最顯著的優勢在于效率,僅需傳統SFT(監督微調)與強化學習相結合方法的1/50算力,就能讓學生模型達到教師模型的性能峰值。


      羅福莉指出,這一框架為構建一個“自我強化循環系統”奠定了基礎,即今天的學生模型在進化后可以成為明天更強的教師模型,從而實現模型的持續、高效迭代。

      小米的AI版圖:從手機到AGI

      MiMo-V2-Flash的發布,并非一次孤立的技術展示,而是小米AI戰略的重要組成部分。正如羅福莉所言,這只是其AGI路線圖的“第二步”,暗示了后續將有更深入的布局。

      此舉清晰地表明了小米正全力將AI打造為其核心競爭力之一。據摩根士丹利發布的研報觀點稱,此舉“展示了小米對AI研發的承諾”,并預計該公司未來將在云端AI和邊緣AI兩方面取得更多實質性進展。而強大的自研AI底層能力,將為其手機、IoT設備乃至新能源汽車等硬件產品帶來獨特的智能化體驗,構筑更深的生態護城河。

      摩根士丹利認為,MiMo-V2-Flash的推出,不僅可能重塑開源AI模型市場格局,更揭示了小米意圖通過自研AI技術深度賦能其“人車家”全生態的戰略野心。

      十四年前,小米手機以1999元的價格重新定義了旗艦智能手機市場。如今,小米似乎希望通過MiMo-V2-Flash,以其卓越的性能和顛覆性的成本,為開源AI領域帶來一個新的“小米時刻”。


      體驗模型可戳:https://aistudio.xiaomimimo.com/#/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      日媒驚呼:高市早苗故意挑釁中國的目的,是這個?!

      日媒驚呼:高市早苗故意挑釁中國的目的,是這個?!

      環球時報國際
      2025-12-17 00:12:39
      昨天中管干部重要研討班開班,高層講話強調五個“進一步深刻認識和把握”,信息量很大!

      昨天中管干部重要研討班開班,高層講話強調五個“進一步深刻認識和把握”,信息量很大!

      識局Insight
      2025-12-17 07:16:39
      好友相繼緬懷拼湊出,何晴生命最后時光:拮據、變樣、舍不下兒子

      好友相繼緬懷拼湊出,何晴生命最后時光:拮據、變樣、舍不下兒子

      TVB的四小花
      2025-12-16 16:16:30
      華為Mate80價格突崩,這降價是瘋了嗎?

      華為Mate80價格突崩,這降價是瘋了嗎?

      3C毒物
      2025-12-17 00:16:03
      隨著遼寧81-94不敵北京,縱觀全場,這幾人必須為輸球負全責!

      隨著遼寧81-94不敵北京,縱觀全場,這幾人必須為輸球負全責!

      田先生籃球
      2025-12-17 22:16:42
      這可能是2026年A股最大的利好!

      這可能是2026年A股最大的利好!

      小白讀財經
      2025-12-17 16:40:51
      澳大利亞女演員瑞秋疾病去世!

      澳大利亞女演員瑞秋疾病去世!

      下水道男孩
      2025-12-15 23:40:32
      投資95億!海南第一高樓封頂,形如“蓮花”

      投資95億!海南第一高樓封頂,形如“蓮花”

      GA環球建筑
      2025-12-16 22:13:10
      笑麻了!要小心那些很久沒穿的鞋子和衣服,評論區笑出鵝叫聲

      笑麻了!要小心那些很久沒穿的鞋子和衣服,評論區笑出鵝叫聲

      有趣的火烈鳥
      2025-12-17 13:01:06
      突發公告!鄭明輝逝世,官網已變黑白

      突發公告!鄭明輝逝世,官網已變黑白

      中國基金報
      2025-12-17 20:52:52
      連續退賽80天,鄭欽文再破天花板,讓李娜和整個網壇“沉默”了

      連續退賽80天,鄭欽文再破天花板,讓李娜和整個網壇“沉默”了

      好賢觀史記
      2025-12-17 14:07:35
      四川退休人員1088萬人,共發放3982.7億養老金,人均養老金多少?

      四川退休人員1088萬人,共發放3982.7億養老金,人均養老金多少?

      云鵬敘事
      2025-12-17 08:16:13
      瑪莎拉蒂中型兩天被搶空,35.88萬以價換量,外觀豪華,續航533Km

      瑪莎拉蒂中型兩天被搶空,35.88萬以價換量,外觀豪華,續航533Km

      小史談車
      2025-12-16 22:23:28
      美國WWE運動員約翰-塞納退役,曾出演《大黃蜂》、《自殺小隊》

      美國WWE運動員約翰-塞納退役,曾出演《大黃蜂》、《自殺小隊》

      懂球帝
      2025-12-17 15:31:13
      俄羅斯免簽旅游全是坑?帶你體驗一個制裁中的國家

      俄羅斯免簽旅游全是坑?帶你體驗一個制裁中的國家

      觀察者網
      2025-12-17 13:31:34
      張本智和奪冠后,國乒沉默了!還得是鄧亞萍敢說話,王楚欽太難了

      張本智和奪冠后,國乒沉默了!還得是鄧亞萍敢說話,王楚欽太難了

      好乒乓
      2025-12-17 11:54:19
      55歲三星長公主李富真露面!有家族遺傳病走路蹣跚,兒子讓她增光

      55歲三星長公主李富真露面!有家族遺傳病走路蹣跚,兒子讓她增光

      好賢觀史記
      2025-12-17 16:09:00
      張韶涵汕頭巡演造型“翻車”,被吐槽裁員裁到大動脈

      張韶涵汕頭巡演造型“翻車”,被吐槽裁員裁到大動脈

      大象新聞
      2025-12-17 14:21:08
      傷亡700人,中方援建大橋被炸,中械軍大勝,大批導彈成戰利品

      傷亡700人,中方援建大橋被炸,中械軍大勝,大批導彈成戰利品

      愛情畢業了
      2025-12-17 08:28:28
      盟友一哄而散,與中國決裂的立陶宛急忙建小組,全力尋求中國諒解

      盟友一哄而散,與中國決裂的立陶宛急忙建小組,全力尋求中國諒解

      趣文說娛
      2025-12-17 15:47:31
      2025-12-18 00:52:49
      華爾街見聞官方 incentive-icons
      華爾街見聞官方
      中國領先的金融商業信息提供商
      139028文章數 2651845關注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      捐贈博物館價值8800萬的名畫現身拍賣市場 捐贈方發聲

      頭條要聞

      捐贈博物館價值8800萬的名畫現身拍賣市場 捐贈方發聲

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝熱播劇姐弟戀真談了???

      財經要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      時尚
      本地
      旅游
      親子
      軍事航空

      你算老幾?我算老己!

      本地新聞

      云游安徽|踏過戰壕與石板,讀一部活的淮北史

      旅游要聞

      泰山桃花峪游覽路調整開放時間

      親子要聞

      撒潑打滾的娃媽媽只有一早就制服了

      軍事要聞

      最新現場:山東艦完成年度最后一次海上訓練

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文无码第一页| 亚洲成a人片在线观看中 | 国产无套精品一区二区三区| 欧美午夜精品久久久久久浪潮 | 华安县| 永久免费无码av网站在线观看| 少妇把腿扒开让我爽爽视频| 五月婷婷中文字幕| 无码日韩精品一区二区免费96| 亚洲中文字幕国产| 亚洲成a人v欧美综合天堂下载| 欧美大黑bbbbbbbbb| 麻豆妓女爽爽一区二区三| 绝顶高潮videos合集| 亚洲成人在线| 策勒县| 99精品国产丝袜在线拍国语| 在线a视频网站| 亚洲国产精品综合久久20| 不卡黄片| 人摸人人人澡人人超碰97| 欧美精品人妻| 亚洲 欧美 清纯 校园 另类| 色五月激情五月| 国产乱子影视频上线免费观看| 91丨国产丨白浆秘?3D动漫| 特级做a爰片毛片免费看无码| 国产免费无码一区二区三区| jizz.jizz| 元氏县| 色综合久久蜜芽国产精品 | 亚洲SV日韩无码久久| 中文有码无码人妻在线| 亚洲激情一区二区三区视频| 日本黄色小说| 中文字幕亚洲有码| 国产精品美女久久久久av福利| 日本三级香港三级三级人妇久| 日本熟妇视频| 日韩人妻无码中文字幕视频| 国产女人好紧好爽|