<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      羅福莉首秀前,小米突然發布!代碼全球最強,總體媲美DeepSeek-V3.2【附實測】

      0
      分享至


      智東西
      作者 程茜
      編輯 李水青

      智東西12月17日報道,今天,小米發布并開源了最新MoE大模型MiMo-V2-Flash,總參數309B,激活參數15B。今日上午,小米2025小米人車家全生態合作伙伴大會上,Xiaomi MiMO大模型負責人羅福莉將首秀并發布主題演講。


      該模型專為推理、編碼和Agent場景構建,支持混合思維模式,允許用戶切換模型是“思考”還是即時回答。它能一鍵生成功能齊全的HTML網頁,并與Claude Code、Cursor和Cline等氛圍編碼框架協同。該模型提供256k上下文窗口,能夠完成數百輪Agent交互和工具調用的任務。

      基準測試結果顯示,MiMo-V2-Flash的性能基本與DeepSeek-V3.2相當,僅在不使用任何工具輔助的“人類最后一場考試”和創意文本生成評估ARENA-HARD中略遜色于DeepSeek-V3.2,但時延更小。


      MiMo-V2-Flash能以每秒150個token的速度實現極其快速的推理,價格方面,其每百萬輸入token 0.7元、每百萬輸出token 2.1元。


      小米已經開源了MiMo-V2-Flash所有內容,并向開發者社區SGLang貢獻了所有推理代碼,API限時免費。目前,用戶可以在網頁端免費體驗MiMo-V2-Flash。

      開源地址:https://t.co/4Etm0yZKTL

      體驗地址:https://aistudio.xiaomimimo.com/#/

      技術報告:https://github.com/XiaomiMiMo/MiMo-V2-Flash/blob/main/paper.pdf

      一、能寫長文、做精美網頁,但實測尚不穩定

      智東西先實測了下MiMo的網頁開發能力。

      首先,智東西讓其生成了一個電商頁面,需要包含商品主圖輪播、規格選擇、價格、庫存等要素。代碼生成后,MiMo會在右側顯示預覽界面,除查看商品大圖功能需要在完整版使用,其他元素幾乎和真實的線上購物沒有差別。


      然后加大難度,智東西讓其生成了一個網頁版迷宮闖關小游戲,需要包含四個難度,能通過鼠標和鍵盤控制。在生成的網頁里,MiMo還增加了提示、積分、計時等功能,整個交互體驗更加完整。


      智東西還讓其生成了“圣誕樹裝飾”交互網頁。網頁左側有彩燈、鈴鐺、星星、禮物盒、蝴蝶結,可以拖動這些物品裝飾到右側的圣誕樹上,也可以一鍵清空或者直接生成隨機裝飾。整個畫面會不斷飄落雪花,還可以播放背景音樂。


      對于聊天能力,智東西先讓MiMo“用程序員的語氣安慰一只失戀的貓”,MiMo會讓小貓“清理緩存”忘掉不開心的事,還讓小貓“升級硬件”,順便幫小米打了波廣告。


      最后智東西讓MiMo生成了一部科幻懸疑題材的AI短劇劇本。一上來,MiMo就給出了深潛記憶提取頭盔、真理之環AI倫理防火墻兩個關鍵要素,通過檢索發現,MiMo在后續劇情中將這兩大物體融入進去,直接作為推動劇情發展的關鍵。


      此外,小米在官方博客也放出了不少案例。

      首先是網頁生成能力上,其第一個官方案例是“用HTML生成一個漂亮、可用的macOS模擬操作系統”。在最終的生成界面中,包含了基本的macOS風格桌面圖標,還可以切換背景、打開Finder。


      其次是,打造“豪華互動圣誕樹”高保真3D網頁應用,并要求視覺效果奢華,MiMo的生成結果能切換圣誕樹和混沌狀態,支持手勢交互等。


      第三個演示是用HTML創建交互式太陽系探測器。當用戶點擊每個球體就會出現行星的簡介。


      智東西也讓MiMo“用HTML創建一個教育性的交互式太陽系探索器”,不過最后的結果并不如官方演示的質感。其第一次生成時行星無法選擇,重新生成后可選擇行星下面的選項直接不見了。


      聊天能力方面,MiMo既能回答“大語言模型擁有知識嗎”這類硬核科普類知識。


      MiMo還可以回答“要不要吃長生不老藥丸”,MiMo還會站在人類視角分析要不要吃、可能有哪些條件。


      此外,該模型還具備長文本撰寫能力,其可以“寫一個關于誤送信件的憂郁愛情故事”。


      MiMo還能寫深刻的非虛構作品,如以一位獨居老人為中心,以他一周內收到的郵件為主,探討現代社會中的孤獨。


      二、專為推理、編碼和Agent構建,與K2 Thinking和DeepSeek V3.2 Thinking相當

      在數學競賽AIME 2025和科學知識基準GPQA-Diamond中,MiMo-V2-Flash的表現是開源模型中前二。在軟件工程能力的SWE驗證與多語言基準測試中,MiMo-V2-Flash在所有開源模型中位列第一,與全球頂尖閉源模型齊名。

      從總的基準測試結果來看,MiMo-V2-Flash在大多數推理基準測試中的性能可與K2 Thinking和DeepSeek V3.2 Thinking相當,同時保持高質量開放式回答的競爭力。

      在長上下文評估中,MiMo的模型超過了K2 Thinking。


      在Agent任務中,MiMo-V2-Flash在SWE-Bench Verified中超越所有開源競爭對手,性能接近 GPT-5-High。在SWE-Bench多語版本中,MiMo-V2-Flash解決了71.7%的問題。

      在搜索Agent評估方面,MiMo-V2-Flash在BrowseComp上得分為45.4,配合上下文管理進一步提升至58.3。


      小米已經共享所有推理代碼至SGLang并開源,社區實測單機結果如下:

      在Prefill單機吞吐約50000 toks/s的條件下,不同Context Length都取得了優越的TTFT性能。


      得益于3層MTP,在16K的Context Length情況下,Decode可以做到單機吞吐5000 ~ 15000 toks/s的同時達到151~115 toks/s的單請求吞吐。


      三、引入MTP訓練,后訓練階段提出MOPD

      MiMo-V2-Flash的效率提升是因為其為高通量推理設計了創新架構進步。

      該模型全局注意力(GA)和滑動窗口注意力(SWA)的1:5混合結構。小米MiMo研究團隊大量的實證結果表明,SWA簡單、高效且易于使用,在通用任務、長上下文負載和推理方面整體表現優于線性注意力。


      它還提供固定大小的KV緩存,便于與現有的訓練和推理基礎設施集成。

      研究人員重新定義了并行解碼,以實現極高的輸出token吞吐量:通過引入多詞元預測(MTP)訓練,提升了基礎模型的能力,并在推理過程中并行驗證了MTP。


      MiMo-V2-Flash利用MTP作為原生草稿模型進行自我推測解碼,實現了實際部署加速。

      大語言模型的解碼過程本質上受限于內存,這是由其低運算密度特性決定的。業界通常采用批量級并行技術提升前饋網絡(FFN)的運算密度,但該方法對注意力計算環節并無增益,原因在于每個推理請求都需維護獨立的KV cache。

      相比之下,MTP技術通過一次性生成多個草稿token,同步提升了前饋網絡(FFN)與注意力機制的運算密度,后續主模型可對這些草稿token進行并行驗證。這種方案能夠實現token級并行計算,且不會增加KV cache的輸入輸出開銷。

      在MiMo-V2-Flash模型中,MTP模塊采用稠密前饋網絡來控制參數量,同時使用滑動窗口注意力機制,從而降低KV cache與注意力計算的成本。

      實測數據顯示,3層結構的MTP模塊可達到2.8-3.6個token的有效接受長度,并實現2.0-2.6倍的推理速度提升。


      MiMo-V2-Flash預訓練使用FP8混合精度和原生32k序列長度,使用27T token進行訓練。

      在后訓練階段,為高效拓展強化學習的計算規模,同時增強模型的推理能力與智能體自主決策能力,研究人員提出了多教師在線策略蒸餾(MOPD)。

      該范式先通過監督微調(SFT)或強化學習(RL)技術得到各領域的專家教師模型,再讓學生模型基于自身的策略分布進行采樣,并利用多個教師模型提供的稠密型token級獎勵信號完成優化。

      MOPD訓練只需不到傳統SFT+RL流程的1/50計算資源,即可匹配教師模型的峰值表現。

      此外,MOPD采用解耦設計,支持新教師與ORM(教學與學習)的靈活整合,自然實現“教學與學習”閉環迭代,精煉學生模式可演變為更強的教師,實現持續自我提升的能力。


      結語:小米大模型研發踩下油門

      小米憑借混合注意力機制與MOPD等技術創新,大幅優化大模型的研發成本與運行效率;同時開源全部相關成果,有效降低行業研發門檻。此外,近幾個月以來,Xiaomi MiMo大模型團隊踩下油門,發布數篇論文并開源多個模型。

      12月5日,小米集團合伙人、總裁盧偉冰透露,公司AI大模型業務過去四個季度投入環比增速超50%,目前進展“已超出董事會預期”,并宣布將AI與“現實世界深度結合”列為未來十年核心戰略。同時,小米正式啟動全球人才招募計劃,單崗位薪酬上限開至千萬元級別,目標“在最短時間內補齊大模型尖端人才缺口”。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      4死1傷!柳州69歲老人砍鄰居跳樓身亡疑長期忍受被小孩吵不得休息

      4死1傷!柳州69歲老人砍鄰居跳樓身亡疑長期忍受被小孩吵不得休息

      歷史偉人錄
      2025-12-17 15:01:17
      被欠錢的山東球迷已去世,戴琳在其離世當天還5000元,球迷家屬發文

      被欠錢的山東球迷已去世,戴琳在其離世當天還5000元,球迷家屬發文

      瀟湘晨報
      2025-12-16 12:07:50
      大瓜!西安一健身教練被指勾引45歲有夫之婦,更多出軌細節流出…

      大瓜!西安一健身教練被指勾引45歲有夫之婦,更多出軌細節流出…

      火山詩話
      2025-12-17 10:21:05
      事業巔峰遠赴美國,被老外“玩膩”后晚年回國,如今變成了這樣!

      事業巔峰遠赴美國,被老外“玩膩”后晚年回國,如今變成了這樣!

      歸史
      2025-12-09 11:10:44
      80后已經有1100萬人提前下車了。

      80后已經有1100萬人提前下車了。

      愛吃糖的貓cat
      2025-11-16 18:27:38
      買了5輛車后才知道,普通家庭買車優先看品牌,很多人不明白!

      買了5輛車后才知道,普通家庭買車優先看品牌,很多人不明白!

      涵豆說娛
      2025-12-02 09:36:15
      知名演員官宣:已退出美國國籍,正式成為中國公民!

      知名演員官宣:已退出美國國籍,正式成為中國公民!

      草莓解說體育
      2025-12-17 10:08:45
      阿薩德一家在莫斯科近況曝光:重操眼科醫生舊業、女兒從莫斯科國際關系學院剛畢業

      阿薩德一家在莫斯科近況曝光:重操眼科醫生舊業、女兒從莫斯科國際關系學院剛畢業

      紅星新聞
      2025-12-16 14:13:17
      王炸登場,電腦端最強輸入法來了!

      王炸登場,電腦端最強輸入法來了!

      黑貓科技迷
      2025-12-17 11:40:01
      越南軍艦強闖臺海?轟6K掛彈起飛!中越這筆賬,今天必須算清

      越南軍艦強闖臺海?轟6K掛彈起飛!中越這筆賬,今天必須算清

      大國知識局
      2025-12-14 18:16:05
      iOS 26.2正式版真正有用的 7 個新功能,更新后不打開等于白升

      iOS 26.2正式版真正有用的 7 個新功能,更新后不打開等于白升

      小兔子發現大事情
      2025-12-16 00:27:59
      12月17日人民幣對美元中間價調升29個基點

      12月17日人民幣對美元中間價調升29個基點

      證券時報
      2025-12-17 09:31:03
      普京智囊做出預言:下一個爆發戰爭的地方既不是臺海,也不是南海

      普京智囊做出預言:下一個爆發戰爭的地方既不是臺海,也不是南海

      古史青云啊
      2025-12-13 14:25:22
      女生小肚子突出,千萬警惕這種情況(不是胖)!

      女生小肚子突出,千萬警惕這種情況(不是胖)!

      瑜伽解剖學
      2025-12-14 21:05:04
      糖尿病最怕的早餐!醫生再三強調:寧可餓著,也別碰這5種早餐

      糖尿病最怕的早餐!醫生再三強調:寧可餓著,也別碰這5種早餐

      讀懂世界歷史
      2025-12-17 21:28:48
      人類對某魚的開發不足1%,網友:只有你想不到,沒有你買不到的

      人類對某魚的開發不足1%,網友:只有你想不到,沒有你買不到的

      奇特短尾矮袋鼠
      2025-12-02 07:45:05
      英國游客吃燒烤沒給錢,次日帶翻譯來道歉,攤主一句話老外瞪大眼睛

      英國游客吃燒烤沒給錢,次日帶翻譯來道歉,攤主一句話老外瞪大眼睛

      卡西莫多的故事
      2025-11-02 14:02:25
      FBI全美收網!13名華人跨州偷“地溝油”被捕

      FBI全美收網!13名華人跨州偷“地溝油”被捕

      華人生活網
      2025-12-17 04:59:45
      孫穎莎的診斷結果出來了,醫生直接下了禁賽令

      孫穎莎的診斷結果出來了,醫生直接下了禁賽令

      最愛乒乓球
      2025-12-18 00:06:58
      張含韻的奶欲更勾人,36歲依舊童顏,身材卻飽滿成熟韻味滿滿

      張含韻的奶欲更勾人,36歲依舊童顏,身材卻飽滿成熟韻味滿滿

      草莓解說體育
      2025-11-20 13:10:19
      2025-12-18 02:28:49
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      10926文章數 116928關注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      墜亡女教師有已婚哥哥和未婚弟弟 父母被指不愿退彩禮

      頭條要聞

      墜亡女教師有已婚哥哥和未婚弟弟 父母被指不愿退彩禮

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝熱播劇姐弟戀真談了???

      財經要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      時尚
      房產
      旅游
      本地
      教育

      你算老幾?我算老己!

      房產要聞

      封關前夕!豪庭銘苑超前交付,敬呈海口生活新范本

      旅游要聞

      圍爐煮茶雅興足 暖游京冬樂趣多

      本地新聞

      云游安徽|踏過戰壕與石板,讀一部活的淮北史

      教育要聞

      高三一輪復習,別太聰明,踏實一點

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲乳大丰满中文字幕| 蜜桃人妻无码AV天堂二区| www97| Z〇Z○女人ZOZO另类| v一区无码内射国产| 乱熟女高潮一区二区在线| 日本边吃奶边摸边做在线视频| 久久内射| 亚太无码| 久久久久国产一区二区| 色偷偷av男人的天堂| 最新午夜男女福利片视频| 国产精品被熟女| 亚洲色欲av| 欧美性猛交99久久久久99按摩| 国内自拍小视频在线看| 久久99精品久久久久| 桦川县| 欧美高清精品一区二区 | 久久99精品国产.久久久久久| 国产三级a三级三级| 欧美精品黑人粗大| 少妇爽到呻吟的视频| 国产乱子伦真实精品!| 色哟哟网站在线观看| 人妻无码熟妇乱又伦精品视频| 91亚洲国产成人精品性色| 临城县| 狠狠色综合tv久久久久久| 亚洲国产精品乱码一区二区| 亚洲无码中出| 宁津县| 粗大的内捧猛烈进出小视频| 国产福利微视频一区二区| 国产又粗又猛又爽又黄AV| 人妻?日韩?中文?无码?制服 | 亚洲日韩欧美国产高清αv| 玖玖国产| 土默特左旗| 日韩人妻一区二区三区蜜桃视频| 天海翼无码在线|