網易首頁 > 網易號 > 正文申請入駐

三次“進窄門”，MiniMax走向AGI深處

2026-04-09 12:06:27　來源: 數智前線

甘肅舉報

分享至

模型就像一輛F1賽車，誰去開、怎么開，結果天差地別。真正決定勝負的，不是賽車本身，而是Harness。

文｜關臨長

“全球大模型牌桌上的席位正變得越來越少，再過一兩年，能留在場上的公司可能不超過五家。”在2026騰訊云上海城市峰會上，MiniMax（稀宇科技）Agent首席架構師繆宇航拋出這一判斷時，語氣篤定：“MiniMax希望成為牌桌上的贏家，我們有信心。”

此時，距離MiniMax在港交所敲鐘，僅僅過去三個月。它的成績擺在眼前：刷新全球AI企業的最快上市紀錄，上市首日股價暴漲109%，兩個月市值一度突破3800億港元。更耐人尋味的是，被譽為“龍蝦之父”的Peter Steinberger在尋求開源模型替代方案時，連發五條推文公開稱贊：MiniMax是最好的開源模型。

一個在巨頭環伺下略顯稚嫩的初上市公司，憑什么讓全球頂流技術領袖如此不吝溢美之詞？又憑什么敢在淘汰賽愈演愈烈的AI浪潮中，喊出“贏家”的野心？

押注全模態，賭AGI的未來

2021年，ChatGPT尚未問世，國內AI圈普遍遵循先聚焦單一垂直模型，再逐步拓展多模態能力的路徑。在商業模式上也以“一客一模型”的定制化路線為主流，所謂的通用化，僅是將生產工具做成了通用外殼，邊際成本居高不下。

在MiniMax創始人、CEO閆俊杰看來，沿著定制化的老路注定走進死胡同，只有讓模型本身通用，定制成本才會歸零，技術才能真正普惠。

2022年初，MiniMax成立的第一天，閆俊杰就定下了一個在當時看來頗為“激進”的戰略：研發AGI（通用人工智能），專注于文本、視頻、語音的全模態通用大模型研發。“AGI是能通過圖靈測試的智能體，既能完成生產任務，也要提供娛樂體驗，單一模態難以企及。”繆宇航解釋。

這是少有人問津的“冷賽道”，一度被貼上“投入大、風險高、回報慢”的標簽。全模態意味著指數級算力需求，一個理想的算力基礎設施，不僅要能承載海量任務，還要足夠高性價比，一小時異常，在千卡規模下可產生數以十萬計的成本開銷。如果不能解決效率問題，再好的愿景也會“死”在起跑線上。

“MiniMax成立的Day1就有騰訊云為我們提供支持，而且沒有因為我們是小公司而怠慢。”繆宇航介紹，從最初的訓練算力集群搭建，到后來的海量數據處理，騰訊云提供了從GPU算力、網絡架構到存儲資源的全棧支撐。如HCC高性能計算集群將上架到訓練時間壓縮至1天，IHN智能高性能網絡將通信損耗壓至6%，GPU利用率提升40%，研發成本削減30%。

得益于底層基建的穩固，MiniMax將更多精力聚焦在模型本身的訓練和工程化上。2025年5月，Speech 02模型綜合性能躍居全球第一，6月推出的Hailuo 02視頻模型，位列AA視頻競技場全球第二。10月，MiniMax發布開源文本大模型M2躋身Artificial Analysis開源第一。

“MiniMax是全球唯一一家在多個模態上都全力投入，且拿到全球領先的創業公司，目前可能只有OpenAI、Google這樣的全球巨頭能做到。”繆宇航底氣十足。

搶抓Agent拐點：卷Token，更卷Harness

2026年初“龍蝦”的爆火，讓AI產業迎來拐點——人工智能的應用范式從Chatbot向AI Agent躍遷。當AI開始像人一樣自主執行任務，比拼的就不再只是模型參數和跑分榜單。

當行業還在沉迷于這些舊指標時，MiniMax更早看到了更深層的真相：主流大模型的能力差距正在縮小，競爭焦點會從卷參數轉向卷“同等Token能產出多少價值”。這才是Agent時代的真正賽場。

什么決定了Token的價值產出？繆宇航用一個比喻點破了關鍵：“模型就像一輛F1賽車，誰去開、怎么開，結果天差地別。真正決定勝負的，不是賽車本身，而是Harness。”

因為Agent時代改變了Token的消耗方式，同樣的模型能力，不同的Harness設計，會讓完成同一任務的Token消耗相差數倍。所以，卷Token，本質上拼的是Harness，拼的是迭代的速度。

讓Harness“快”起來的，正是沙箱。MiniMax迭代模型的速度取決于Agentic RL訓練，需要瞬時啟動上萬個環境，傳統K8S無法滿足“毫秒級拉起”。但和騰訊云一同打造的百萬級吞吐、十萬級并發的Agent訓練沙箱，1分鐘內能拉起超十萬個容器沙箱，百毫秒級啟動速度，用完即銷毀，大幅提升了訓練效率。“這是國內最大的訓練沙箱系統之一，支撐MiniMax模型一月一次迭代，性能迅速提升。”繆宇航說。

與此同時，Agent自主執行帶來的安全困境，也被騰訊云的全棧安全防護一一化解，幫助MiniMax滿足客戶的安全、內容合規需求，抵御外部威脅，讓大模型推理應用更加可靠。

這套圍繞Agent重構的Harness工程，讓MiniMax的極致性價比得以落地。春節期間其發布的M2.5模型成本打到1美元/小時，1萬美元可讓4個Agent不間斷工作一整年。

以Agent為中心的工程思維，也讓MiniMax向AI-Native組織一樣不斷自我進化。目前內部Agent實習生覆蓋近90%員工，實驗室里50%-70%的強化學習工作由Agent自主完成。

Token即電力：中國算力的隱形出海

2026年3月，國家數據局局長劉烈宏披露了一組數據：中國日均Token調用量已突破140萬億，較2024年初增長超1000倍。爆發式增長的數字標志著“Token經濟”已經到來。

而這正是MiniMax早在四年前就預判到的圖景——Token應像電力一樣成為一種標準化的、可全球流通的“能源單位”。

基于這一超前認知，MiniMax在成立之初就確立了“立足中國、面向全球”的定位，通過Talkie AI、海螺AI等產品矩陣在海外市場扎根，B端上給全球超過100多個國家的企業客戶和開發者，提供API服務。目前，其年收入超過73%來自海外，服務全球超2.36億個人用戶和20多萬企業客戶與開發者。

如今，當國內同行陷入“卷Token價格”的泥潭時，MiniMax早早跳出了這個戰場。據招股書顯示，MiniMax僅投入約4.49億美元（2022年至2025年9月）的模型訓練及云服務成本，就躋身全球頂級AI公司之列。這種成本優勢直接轉化為產品定價的競爭力。例如，其API定價僅為海外領先模型的約8%，這導致To-B API業務保持超60%的毛利率。

當然，服務全球市場并非坦途，騰訊云覆蓋全球的計算節點和CDN加速，幫助MiniMax在不同國家和地區順利扎根，保證了全球范圍內的穩定、高效運行。

積累了服務全球用戶的經驗和能力，讓MiniMax對自身定位有了更清晰的認知。在上市后的首個業績電話會上，閆俊杰宣布戰略升級：從大模型公司轉向“AI時代的平臺型公司”。在他看來平臺型是指那些是能夠定義智能邊界，同時在產品與商業層面兌現行業紅利的企業。

回看MiniMax的成長路，敢于押注通用模型，敢于深耕Harness工程，敢于率先出海拓展增長空間——每一步都進窄門，踩在主流認知的對立面。但正是這些“反共識”的選擇，讓一家小公司從牌桌邊緣走到了牌桌中央，并萌生了贏下整場游戲的渴望。

“大模型行業的競爭向來你追我趕、互有勝負，沒有任何一家企業能保證永遠處于技術領先地位，但我們有信心，在未來的關鍵戰役中持續取勝。”閆俊杰說。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.