2月12日,MiniMax在北京舉行了備受矚目的新一代旗艦模型發布會,正式上線了MiniMax M2.5(MiniMax M2.5),這款被定位為“原生Agent生產級模型”的新作,憑借其在編程能力、搜索增強以及辦公生產力方面的顯著突破,迅速點燃了市場熱情。發布當日,MiniMax股價單日漲幅超過20%,在隨后的幾天內累計漲幅高達34.69%,創下了近五天內34.69%的漲幅記錄。
![]()
![]()
一、模型定位:專為Agent場景原生設計的生產級解決方案
MiniMax M2.5并非一款全新技術范式的模型,而是在M2.1基礎上進行的大幅度工程優化和能力增強。它延續了M系列的混合專家模型(MoE)架構,總參數規模達到了2300億,但在推理時僅激活100億參數,真正實現了“小激活、大智慧”的高效計算。
![]()
![]()
最值得關注的是,M2.5是MiniMax首款明確定位為“原生Agent生產級模型”的產品。它通過引入名為Forge的智能體原生強化學習框架,將底層訓練-推理引擎與智能體完全解耦,優化了模型在復雜智能體任務中的響應速度與任務分解能力。這種框架設計,使M2.5在運行SWE-Bench Verified等復雜任務時,端到端運行時間從平均31.3分鐘縮短至22.8分鐘,提升幅度達到了37%。
二、性能突破:編程能力與工具調用實現國產化第一
在編程能力方面,M2.5的表現尤為搶眼。它在SWE-Bench Verified權威榜單中得分達到了80.2%,在Multi-SWE-Bench中得分為51.3%,較上一代顯著提升,并且在跨語言復雜環境中超越了國際頂尖模型Claude Opus 4.6,達到了行業最好的水平。
![]()
除了編程,M2.5在搜索增強(Search)和工具調用(Tool)場景也表現出了國產模型的領跑優勢。它在BrowseComp和Wide Search等基準測試中實現了行業領先的性能,特別是在面對不熟悉的腳手架環境時,展現出了更高的泛化能力。官方數據顯示,M2.5在真實世界專業任務中表現優異,能夠通過更少的搜索輪次實現更好的結果,效率提升約20%。
三、核心優勢:成本極低,效率極高
MiniMax M2.5最引人注目的不僅是性能,更是其“超級性價比”。它的運行成本是Claude Opus 4.6的十分之一到二十分之一。以每秒100 token的速率連續工作一小時,其成本僅為1美元;以每秒50 token的速率運行,成本降至0.3美元。
![]()
官方還推出了兩個版本:M2.5和M2.5-Lightning,兩者在能力上完全相同,僅在速度上存在差異。M2.5-Lightning的吞吐量達到100 tokens/秒,是其他前沿模型的兩倍速度,價格為每百萬輸入tokens 0.3美元,每百萬輸出tokens 2.4美元。
四、市場反響:股價大漲35%,掀起國產化浪潮
在當前全球AI模型高價壟斷的背景下,MiniMax M2.5的發布無疑是對市場的一次重大沖擊。其發布當日,MiniMax股價在盤中一度超過20%,總市值突破1800億港元;在隨后的幾天內,累計漲幅高達34.69%。業內人士指出,這不僅是MiniMax公司的重大勝利,更是國產大模型在成本與效率上首次實現“追趕并超越”的標志性事件。
結語
MiniMax M2.5的發布,標志著國產大模型在Agent場景下的性能瓶頸被成功突破。它不僅在技術上實現了對Claude Opus 4.6的正向超越,更在商業模式上通過極低的成本為普通開發者和企業提供了強大的生產力工具,徹底顛覆了“高性能=高成本”的傳統認知,為國產化AI的普惠化奠定了堅實基礎。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.