![]()
編輯|Panda
這兩天,中國(guó) AI 行業(yè)關(guān)注的核心無(wú)疑是 MiniMax。
12 月 21 日,MiniMax(稀宇科技)正式向港交所遞交招股書(shū),披露的一連串?dāng)?shù)字瞬間引爆了輿論場(chǎng):賬上坐擁超10 億美元的現(xiàn)金儲(chǔ)備,2025 年前九個(gè)月?tīng)I(yíng)收同比激增174.7%,而在保持高強(qiáng)度研發(fā)的同時(shí),經(jīng)調(diào)整凈虧損控制在1.86 億美元。
資本市場(chǎng)的喧囂還沒(méi)結(jié)束,23 日,MiniMax 又反手甩出了一張技術(shù)牌:正式上線MiniMax M2.1模型。
![]()
這并非一次常規(guī)的版本迭代。根據(jù)官方披露的信息,M2.1 在 SWE-bench Multilingual 多語(yǔ)言評(píng)測(cè)中以 72.5% 的成績(jī)拿下了 SOTA,超越了 Gemini 3 Pro 和 Claude Sonnet 4.5。
![]()
更重要的是,它不再局限于 Python 或前端代碼的生成,而是向Rust、Java、C++ 等更廣泛的后端語(yǔ)言發(fā)起了進(jìn)攻,試圖解決過(guò)往模型「寫(xiě)得像但跑不通」、「缺乏工程感」的痛點(diǎn)。
同時(shí),M2.1 大幅強(qiáng)化了原生 Android 和 iOS 的開(kāi)發(fā)能力,打出了「Not only vibe WebDev, but also vibe AppDev」的口號(hào)。
不僅如此,為了給這種「從零到一」的全棧能力提供硬核支撐,MiniMax 還構(gòu)建并開(kāi)源了全新基準(zhǔn)VIBE(Visual & Interactive Benchmark for Execution in Application Development)。不同于傳統(tǒng)基準(zhǔn),VIBE 涵蓋了 Web、仿真、Android、iOS 及后端五大核心子集,并引入創(chuàng)新的Agent-as-a-Verifier (AaaV)范式,能夠自動(dòng)評(píng)估生成的 Application 在真實(shí)運(yùn)行環(huán)境中的交互邏輯與視覺(jué)美感。在這場(chǎng)「全棧構(gòu)建」的終極測(cè)試中,M2.1 以平均 88.6 分的成績(jī)展現(xiàn)了卓越實(shí)力,不僅在幾乎所有子集上顯著優(yōu)于 Claude Sonnet 4.5,更逼近了 Claude Opus 4.5 的水準(zhǔn)。
![]()
同時(shí),憑借強(qiáng)大的交錯(cuò)思維與指令跟隨能力,MiniMax M2.1 還能集成「復(fù)合指令約束」,從而可以更輕松地完成辦公自動(dòng)化任務(wù)。
更令開(kāi)發(fā)者驚喜的是其落地的速度與廣度:M2.1 第一時(shí)間就可無(wú)縫集成至 Claude Code、Cursor 等主流 AI 編程工具中。
配合更快的響應(yīng)速度、更簡(jiǎn)潔的思維鏈以及大幅降低的 token 消耗,它顯然是有備而來(lái),意在直接切入開(kāi)發(fā)者的核心工作流。
這種「今天秀肌肉,明天亮技術(shù)」的節(jié)奏顯然不是巧合。在外界還在爭(zhēng)論一家成立剛四年的公司為何能跑出如此驚人的 IPO 速度時(shí),MiniMax M2.1 的發(fā)布則是一種有力的回應(yīng):它試圖用模型的迭代速度,來(lái)詮釋招股書(shū)里高效研發(fā)的數(shù)字指標(biāo),以及為何這家公司值得眾多明星投資人的信任與多輪投資。
![]()
作為一家長(zhǎng)期關(guān)注 AI 技術(shù)的媒體,在這一波喧囂過(guò)后的 48 小時(shí)里,我們拿到 M2.1 的接口,把它扔進(jìn)了開(kāi)發(fā)環(huán)境中,用真實(shí)的任務(wù)對(duì)其進(jìn)行了考驗(yàn)。
畢竟,招股書(shū)是給投資人看的面子,而模型能力才是開(kāi)發(fā)者真金白銀投票的里子。這份體驗(yàn)報(bào)告或可成為洞見(jiàn)這家公司真實(shí)技術(shù)底蘊(yùn)的切口。
實(shí)測(cè):從偏科到全能
在過(guò)去很長(zhǎng)一段時(shí)間里,MiniMax 給開(kāi)發(fā)者的印象往往帶著鮮明的標(biāo)簽:它的語(yǔ)音合成極其逼真,視頻生成的表現(xiàn)力備受贊譽(yù)(海螺),角色扮演能力也在 C 端應(yīng)用(如星野)中大放異彩。如果說(shuō)大模型班級(jí)里有特長(zhǎng)生,那么 MiniMax 以前更像是一個(gè)極具天賦的文科生或藝術(shù)生。
然而,要支撐起招股書(shū)中描繪的 AGI 藍(lán)圖,光有情商可不夠。在企業(yè)級(jí)應(yīng)用和復(fù)雜的生產(chǎn)力場(chǎng)景中,推理能力和模型使用工具的能力才是檢驗(yàn)?zāi)P椭巧痰挠餐ㄘ洝4饲埃仨毘姓J(rèn)的是,作為開(kāi)源模型,M2 與 Claude Sonnet 4.5 或 GPT-5 (thinking) 等國(guó)際頂尖模型相比,在部分任務(wù)上確實(shí)還差點(diǎn)意思。
這也正是 M2.1 發(fā)布的戰(zhàn)略意義所在:一次針對(duì)性的進(jìn)化。
為了驗(yàn)證 M2.1 是否真的補(bǔ)齊了編程這塊短板,我們決定跳過(guò)那些基礎(chǔ)的「寫(xiě)首藏頭詩(shī)」或「畫(huà)個(gè)貪吃蛇」,直接將它置于真實(shí)的開(kāi)發(fā)者視角下,以了解其在代碼重構(gòu)、復(fù)雜邏輯規(guī)劃等方面的真實(shí)表現(xiàn)。
首先來(lái)一個(gè)相對(duì)簡(jiǎn)單的任務(wù):蝦仁模擬器,看看我們能否在自己的電腦上扮演這位歷經(jīng)無(wú)數(shù)世界的穿越者。首先,構(gòu)建一個(gè)簡(jiǎn)單的提示詞:
我想構(gòu)建一個(gè)蝦仁模擬器小游戲,核心主題是:你是蝦仁,你又穿越了。游戲內(nèi)容是主角蝦仁穿越到不同的朝代或者世界(比如喪尸世界、修仙世界、賽博世界),游戲后臺(tái)使用 AI: MiniMax-M2.1。請(qǐng)先規(guī)劃這個(gè)項(xiàng)目,讓我選擇游戲方式和技術(shù)棧等,并將任務(wù)規(guī)劃放入 task.md 文件。
在 Claude Code 配置好 MiniMax M2.1 之后,直接輸入提示詞開(kāi)始構(gòu)建!
4 倍速視頻(以下視頻都是 4 倍速)
整個(gè)過(guò)程耗時(shí)不到 6 分鐘。給這個(gè)小游戲配置好 API,來(lái)初步試試效果:
命令行的界面玩起來(lái)總歸是不方便,也不美麗,接下來(lái)我們繼續(xù)推進(jìn),讓 MiniMax M2.1 開(kāi)發(fā)一個(gè)直觀好看的 UI。
給這個(gè)游戲開(kāi)發(fā)一個(gè)漂亮的網(wǎng)頁(yè) UI,整體使用像素風(fēng)格,使用莫蘭迪色系配色。使用 JavaScript。支持深色和淺色模式切換。界面上加一個(gè)隨機(jī)穿越的按鈕。
這下,效果好多了。MiniMax M2.1 的審美著實(shí)在線!
你甚至能一句話就創(chuàng)建出一個(gè)炫酷的個(gè)人主頁(yè):
MiniMax M2.1 為漫威超級(jí)英雄黑寡婦創(chuàng)建的個(gè)人主頁(yè)
接下來(lái),我們大幅提升任務(wù)難題,來(lái)考驗(yàn)一下 MiniMax M2.1 的多語(yǔ)言編程能力。我們構(gòu)想一個(gè)較為復(fù)雜的任務(wù),并在 AI 的輔助下撰寫(xiě)了一個(gè)提示詞:
![]()
然后我們將其放入任務(wù)文件夾的「任務(wù).md」文件中,直接給出執(zhí)行指令:
讀取文件夾中的任務(wù).md 文件并實(shí)現(xiàn)這個(gè)項(xiàng)目。
這個(gè)任務(wù)的難度較大,MiniMax M2.1 并沒(méi)有一蹴而就,但整個(gè)過(guò)程非常接近真實(shí)的開(kāi)發(fā)體驗(yàn)。在與其進(jìn)行多輪互動(dòng)后,它最終交出了一份令人滿意的答卷。
值得一提的是,在這個(gè)過(guò)程中我們遇到了多次報(bào)錯(cuò),例如 crates.io 鏡像源問(wèn)題導(dǎo)致無(wú)法下載組件、Go 語(yǔ)言中 % 運(yùn)算符不能用于 float64 而需改用 math.Mod () 函數(shù)等。
令人驚喜的是,這些問(wèn)題并沒(méi)有成為阻礙。我們只需將報(bào)錯(cuò)信息直接反饋給 MiniMax M2.1,它就能迅速理解上下文,自動(dòng)完成修復(fù)工作,并編寫(xiě)了各個(gè)模塊的單元測(cè)試。
最后,我們繼續(xù)讓 MiniMax M2.1 將這三個(gè)使用不同語(yǔ)言編寫(xiě)的模塊連接了起來(lái)。
![]()
最終,我們得到了這樣一個(gè)系統(tǒng):
![]()
左側(cè)為 React 前端,右上為 Go 語(yǔ)言寫(xiě)的網(wǎng)關(guān),右下為 Rust 寫(xiě)的核心程序
我們還進(jìn)行了其它一些實(shí)測(cè),包括將多年前的 C++ 游戲庫(kù)重構(gòu)為 Python 版本、修改了一個(gè) Obsidian 插件、一個(gè)輔助發(fā)推文的小工具以及一個(gè)「技能吃豆人」小游戲。
![]()
技能吃豆人增加了技能豆,吃下后可以獲得技能,比如這里的穿墻能力
這些實(shí)測(cè)證明,MiniMax M2.1 不僅能寫(xiě)代碼,更能像一個(gè)成熟的工程師一樣解決問(wèn)題。
技術(shù)與商業(yè)的互文
當(dāng)我們把視線從 IDE 編輯器的代碼窗口移開(kāi),重新審視那份數(shù)百頁(yè)的招股書(shū)時(shí),會(huì)發(fā)現(xiàn) M2.1 的發(fā)布其實(shí)是解讀 MiniMax 商業(yè)邏輯的一把關(guān)鍵鑰匙。
在外界看來(lái),或許招股書(shū)是財(cái)務(wù)數(shù)字的游戲,而模型發(fā)布是技術(shù)圈的狂歡。但在 MiniMax 這里,兩者構(gòu)成了緊密的互文關(guān)系。
研發(fā)杠桿率:打破「燒錢換增長(zhǎng)」的魔咒
招股書(shū)中有一個(gè)容易被忽視但極具含金量的數(shù)據(jù)對(duì)比:2025 年前九個(gè)月,MiniMax 的營(yíng)收同比增長(zhǎng)了 174.7%,但同期研發(fā)費(fèi)用僅增長(zhǎng)了約 30%。
![]()
這個(gè)顯著的「剪刀差」修正了外界對(duì)于大模型公司「研發(fā)無(wú)底洞」的刻板印象。它揭示了一個(gè)關(guān)鍵事實(shí):MiniMax 已經(jīng)跑通了高效的研發(fā)模式。
這意味著,公司不再需要線性地堆砌人力和算力資源來(lái)?yè)Q取模型能力的提升。M2.1 的誕生就是最好的佐證:在研發(fā)投入增速遠(yuǎn)低于營(yíng)收增速的前提下,MiniMax 依然保持了極高的迭代頻率,在短時(shí)間內(nèi)填補(bǔ)了代碼和邏輯推理的短板。對(duì)于二級(jí)市場(chǎng)投資者而言,這種不隨營(yíng)收規(guī)模同比例膨脹的研發(fā)成本結(jié)構(gòu),是驗(yàn)證其商業(yè)模式可擴(kuò)展性(Scalability)的最強(qiáng)證據(jù)。
從聊天機(jī)器人到智能體:MiniMax 的生產(chǎn)力雄心
MiniMax 在招股書(shū)中強(qiáng)調(diào)了其在 C 端應(yīng)用(如星野、海螺 AI)上的統(tǒng)治力。然而,要撐起千億級(jí)的市場(chǎng)想象空間,僅靠聊天是不夠的。M2.1 補(bǔ)齊邏輯和代碼短板,真正的雄心在于對(duì) B 端生產(chǎn)力場(chǎng)景的滲透。
行業(yè)內(nèi)對(duì)于 Agent 能力的評(píng)估標(biāo)準(zhǔn),正在從簡(jiǎn)單的對(duì)話測(cè)試轉(zhuǎn)向更為嚴(yán)苛的基準(zhǔn),例如 Toolathon。這是一個(gè)包含 32 個(gè)專業(yè)軟件(如 Kubernetes、BigQuery)、600 多個(gè)工具的第三方高難度評(píng)測(cè),要求模型在平均 20 輪的交互中完成復(fù)雜的長(zhǎng)程任務(wù)。
M2.1 對(duì)代碼解釋器和工具調(diào)用能力的強(qiáng)化,正是為了應(yīng)對(duì)這種真實(shí)世界復(fù)雜度。當(dāng)一個(gè)模型能夠熟練操作 Docker 容器、管理日歷并自動(dòng)處理電商訂單時(shí),它就從一個(gè) C 端的玩具進(jìn)化成了 B 端的員工。這種能力的躍升,將直接拓寬 MiniMax 開(kāi)放平臺(tái)的客戶半徑,使其能夠承接企業(yè)級(jí)工作流的自動(dòng)化需求。
商業(yè)閉環(huán)的最后一公里
至此,MiniMax 的商業(yè)邏輯形成了閉環(huán):
- C 端產(chǎn)品(星野、海螺)作為數(shù)據(jù)飛輪和現(xiàn)金牛,提供高用戶粘性和直接收入;
- 底層模型(M2.1)通過(guò) MoE 架構(gòu)控制推理成本,通過(guò)技術(shù)補(bǔ)全提升智商上限;
- 開(kāi)放平臺(tái)基于 M2.1 的 Agent 和多模態(tài)能力,切入高價(jià)值的企業(yè)級(jí)市場(chǎng)。
現(xiàn)在的 MiniMax 已左手是資本市場(chǎng)的入場(chǎng)券(招股書(shū)),右手是技術(shù)戰(zhàn)場(chǎng)的沖鋒號(hào)(M2.1)。
對(duì)該公司而言,IPO 是通過(guò)技術(shù)轉(zhuǎn)化為生產(chǎn)力的新起點(diǎn)。M2.1 的發(fā)布證明了,這家公司在叩響港交所大門(mén)的同時(shí),依然保持著對(duì)技術(shù)邊界的極致探索。這種「左手賬本,右手模型」的雙輪驅(qū)動(dòng),或許正是它能在短短四年內(nèi)跑通商業(yè)閉環(huán)的秘密所在。
文中視頻鏈接:
https://mp.weixin.qq.com/s/0FUw5WYa-pffvWdM6vrafA
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.