![]()
模型就像一輛F1賽車,誰去開、怎么開,結果天差地別。真正決定勝負的,不是賽車本身,而是Harness。
文|關臨長
“全球大模型牌桌上的席位正變得越來越少,再過一兩年,能留在場上的公司可能不超過五家。”在2026騰訊云上海城市峰會上,MiniMax(稀宇科技)Agent首席架構師繆宇航拋出這一判斷時,語氣篤定:“MiniMax希望成為牌桌上的贏家,我們有信心。”
此時,距離MiniMax在港交所敲鐘,僅僅過去三個月。它的成績擺在眼前:刷新全球AI企業的最快上市紀錄,上市首日股價暴漲109%,兩個月市值一度突破3800億港元。更耐人尋味的是,被譽為“龍蝦之父”的Peter Steinberger在尋求開源模型替代方案時,連發五條推文公開稱贊:MiniMax是最好的開源模型。
一個在巨頭環伺下略顯稚嫩的初上市公司,憑什么讓全球頂流技術領袖如此不吝溢美之詞?又憑什么敢在淘汰賽愈演愈烈的AI浪潮中,喊出“贏家”的野心?
01
押注全模態,賭AGI的未來
2021年,ChatGPT尚未問世,國內AI圈普遍遵循先聚焦單一垂直模型,再逐步拓展多模態能力的路徑。在商業模式上也以“一客一模型”的定制化路線為主流,所謂的通用化,僅是將生產工具做成了通用外殼,邊際成本居高不下。
在MiniMax創始人、CEO閆俊杰看來,沿著定制化的老路注定走進死胡同,只有讓模型本身通用,定制成本才會歸零,技術才能真正普惠。
2022年初,MiniMax成立的第一天,閆俊杰就定下了一個在當時看來頗為“激進”的戰略:研發AGI(通用人工智能),專注于文本、視頻、語音的全模態通用大模型研發。“AGI是能通過圖靈測試的智能體,既能完成生產任務,也要提供娛樂體驗,單一模態難以企及。”繆宇航解釋。
![]()
這是少有人問津的“冷賽道”,一度被貼上“投入大、風險高、回報慢”的標簽。全模態意味著指數級算力需求,一個理想的算力基礎設施,不僅要能承載海量任務,還要足夠高性價比,一小時異常,在千卡規模下可產生數以十萬計的成本開銷。如果不能解決效率問題,再好的愿景也會“死”在起跑線上。
“MiniMax成立的Day1就有騰訊云為我們提供支持,而且沒有因為我們是小公司而怠慢。”繆宇航介紹,從最初的訓練算力集群搭建,到后來的海量數據處理,騰訊云提供了從GPU算力、網絡架構到存儲資源的全棧支撐。如HCC高性能計算集群將上架到訓練時間壓縮至1天,IHN智能高性能網絡將通信損耗壓至6%,GPU利用率提升40%,研發成本削減30%。
得益于底層基建的穩固,MiniMax將更多精力聚焦在模型本身的訓練和工程化上。2025年5月,Speech 02模型綜合性能躍居全球第一,6月推出的Hailuo 02視頻模型,位列AA視頻競技場全球第二。10月,MiniMax發布開源文本大模型M2躋身Artificial Analysis開源第一。
“MiniMax是全球唯一一家在多個模態上都全力投入,且拿到全球領先的創業公司,目前可能只有OpenAI、Google這樣的全球巨頭能做到。”繆宇航底氣十足。
02
搶抓Agent拐點:卷Token,更卷Harness
2026年初“龍蝦”的爆火,讓AI產業迎來拐點——人工智能的應用范式從Chatbot向AI Agent躍遷。當AI開始像人一樣自主執行任務,比拼的就不再只是模型參數和跑分榜單。
當行業還在沉迷于這些舊指標時,MiniMax更早看到了更深層的真相:主流大模型的能力差距正在縮小,競爭焦點會從卷參數轉向卷“同等Token能產出多少價值”。這才是Agent時代的真正賽場。
什么決定了Token的價值產出?繆宇航用一個比喻點破了關鍵:“模型就像一輛F1賽車,誰去開、怎么開,結果天差地別。真正決定勝負的,不是賽車本身,而是Harness。”
因為Agent時代改變了Token的消耗方式,同樣的模型能力,不同的Harness設計,會讓完成同一任務的Token消耗相差數倍。所以,卷Token,本質上拼的是Harness,拼的是迭代的速度。
讓Harness“快”起來的,正是沙箱。MiniMax迭代模型的速度取決于Agentic RL訓練,需要瞬時啟動上萬個環境,傳統K8S無法滿足“毫秒級拉起”。但和騰訊云一同打造的百萬級吞吐、十萬級并發的Agent訓練沙箱,1分鐘內能拉起超十萬個容器沙箱,百毫秒級啟動速度,用完即銷毀,大幅提升了訓練效率。“這是國內最大的訓練沙箱系統之一,支撐MiniMax模型一月一次迭代,性能迅速提升。”繆宇航說。
與此同時,Agent自主執行帶來的安全困境,也被騰訊云的全棧安全防護一一化解,幫助MiniMax滿足客戶的安全、內容合規需求,抵御外部威脅,讓大模型推理應用更加可靠。
這套圍繞Agent重構的Harness工程,讓MiniMax的極致性價比得以落地。春節期間其發布的M2.5模型成本打到1美元/小時,1萬美元可讓4個Agent不間斷工作一整年。
以Agent為中心的工程思維,也讓MiniMax向AI-Native組織一樣不斷自我進化。目前內部Agent實習生覆蓋近90%員工,實驗室里50%-70%的強化學習工作由Agent自主完成。
03
Token即電力:中國算力的隱形出海
2026年3月,國家數據局局長劉烈宏披露了一組數據:中國日均Token調用量已突破140萬億,較2024年初增長超1000倍。爆發式增長的數字標志著“Token經濟”已經到來。
而這正是MiniMax早在四年前就預判到的圖景——Token應像電力一樣成為一種標準化的、可全球流通的“能源單位”。
基于這一超前認知,MiniMax在成立之初就確立了“立足中國、面向全球”的定位,通過Talkie AI、海螺AI等產品矩陣在海外市場扎根,B端上給全球超過100多個國家的企業客戶和開發者,提供API服務。目前,其年收入超過73%來自海外,服務全球超2.36億個人用戶和20多萬企業客戶與開發者。
如今,當國內同行陷入“卷Token價格”的泥潭時,MiniMax早早跳出了這個戰場。據招股書顯示,MiniMax僅投入約4.49億美元(2022年至2025年9月)的模型訓練及云服務成本,就躋身全球頂級AI公司之列。這種成本優勢直接轉化為產品定價的競爭力。例如,其API定價僅為海外領先模型的約8%,這導致To-B API業務保持超60%的毛利率。
當然,服務全球市場并非坦途,騰訊云覆蓋全球的計算節點和CDN加速,幫助MiniMax在不同國家和地區順利扎根,保證了全球范圍內的穩定、高效運行。
積累了服務全球用戶的經驗和能力,讓MiniMax對自身定位有了更清晰的認知。在上市后的首個業績電話會上,閆俊杰宣布戰略升級:從大模型公司轉向“AI時代的平臺型公司”。在他看來平臺型是指那些是能夠定義智能邊界,同時在產品與商業層面兌現行業紅利的企業。
回看MiniMax的成長路,敢于押注通用模型,敢于深耕Harness工程,敢于率先出海拓展增長空間——每一步都進窄門,踩在主流認知的對立面。但正是這些“反共識”的選擇,讓一家小公司從牌桌邊緣走到了牌桌中央,并萌生了贏下整場游戲的渴望。
“大模型行業的競爭向來你追我趕、互有勝負,沒有任何一家企業能保證永遠處于技術領先地位,但我們有信心,在未來的關鍵戰役中持續取勝。”閆俊杰說。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.