![]()
![]()
“MiMo V2 Pro,第一款「走字兒」的模型。”
作者丨梁丙鑒 吳海明
編輯丨馬曉寧
大模型要怎么收費,眾說紛紜。今天最常見的是訂閱制,都說模型是新時代的基建,但沒見誰家電表是包月的。作為模型層的后起之秀,4 月 3 日,小米發(fā)布了第一款“走字兒”的 Token Plan。
![]()
在這套計費方案中,Token 消耗的最小計數(shù)單位被統(tǒng)一為 Credit。用戶為后者付費,購買額度不一的套餐。在調(diào)用 MiMo 系列的不同模型時,每個 Credit 點數(shù)也對應(yīng)著不同的 Token 額度,換算比例如下:
MiMo-V2-Omni 256k 上下文:1x(消耗 1 Token = 1 Credit)
MiMo-V2-Pro 256k 上下文: 2x(消耗 1 Token = 2 Credits)
MiMo-V2-Pro 256k~1M 上下文: 4x(消耗 1 Token = 4 Credits)
MiMo-V2-TTS:0x(限時免費,不消耗 Credit)
類似流量包的設(shè)計讓用戶對模型調(diào)用有了更大的自由度。在 Anthropic、OpenAI、阿里等主流模型廠商都通過“5 小時滾動窗口”限制用戶的使用時間時,小米此次推出的 Token Plan 取消了這一規(guī)定,支持用戶集中消耗 Token,編程 vibe 到爽。
這是一套完全不同的計費邏輯。
對用戶而言,傳統(tǒng)的訂閱制是用固定成本換取模型調(diào)用權(quán)益,邏輯簡單清晰,易于接受。但任務(wù)難度的波動讓平臺成本難以預(yù)測,模型廠商對用戶加以使用時間和每周請求次數(shù)上限的限制,都是為解決這一問題。
另一種常見方案是按模型調(diào)用次數(shù)計費,同樣可以避免用戶遇到帳單沖擊。但同樣是一次請求,復(fù)雜任務(wù)編程和修改一份簡歷的 Token 成本天差地別,這種方案難以在計費上體現(xiàn)出不同任務(wù)的復(fù)雜度,專業(yè)開發(fā)者的 Token 成本最終會被小白玩家一起分擔。
而小米從 Credit 到 Token 的換算,是對模型文本處理量直接計費,邏輯上確實更易于公平地衡量每個任務(wù)的實際成本。它把 AI 服務(wù)從一種固定消費,變成了隨任務(wù)難度調(diào)整的彈性消耗。
但問題在于,Token 是模型思考的最小單位,普通用戶卻難以預(yù)估一項任務(wù)的實際消耗。當模型輸出從單輪的回答轉(zhuǎn)向直接交付任務(wù)結(jié)果,Token 消耗量更是會呈指數(shù)級增加,對用戶而言又是一重認知負擔。
模型成為新一代基礎(chǔ)設(shè)施的未來已成定局。在 Claude Code、OpenClaw 越發(fā)廣泛地進入生產(chǎn)環(huán)境時,什么是更合理的計費方案?
Xiaomi MiMo Token Plan 提供了一種全新的可能,對它的評價同樣應(yīng)該回到真實場景。為此我們向 Mimo V2 Pro 下達了真實的任務(wù)指令,看看模型的表現(xiàn)如何,以及小米為此開出了什么樣的價格。
01
核心實測:復(fù)雜架構(gòu)設(shè)計與多 Agent 協(xié)同科研
在 OpenClaw 框架之下,我們基于 MiMo V2 Pro 搭建了一套多角色協(xié)作系統(tǒng),將科研流程拆解為五個相對穩(wěn)定的職責:方向規(guī)劃、算法實現(xiàn)、學(xué)術(shù)寫作、文獻整理與數(shù)據(jù)處理。對應(yīng)地,我們引入了五個不同角色的 Agent,分別承擔不同類型的任務(wù):
唐僧:科研戰(zhàn)略與方向規(guī)劃(想清楚要去哪)
孫悟空:算法開發(fā)和工程落地(把事干出來)
豬八戒:學(xué)術(shù)寫作與表達(把話說清楚)
沙僧:文獻整理與知識管理(把信息理順)
白龍馬:數(shù)據(jù)處理與流程自動化(把基礎(chǔ)打好)
目前大模型落地應(yīng)用在工程技術(shù)上存在諸多挑戰(zhàn)。一個常見現(xiàn)象是小范圍的代碼生成已不在話下,但面對復(fù)雜架構(gòu)時,模型往往會出現(xiàn)一致性等問題。
為此我們將首個測試任務(wù)交給孫悟空 Agent,要求它基于公開文本分類數(shù)據(jù)集,完成一個“小樣本垂直領(lǐng)域文本分類基線系統(tǒng)”的開發(fā),借此觀察 MiMo V2 Pro 在代碼實現(xiàn)、復(fù)現(xiàn)以及工程封裝上的表現(xiàn)。
![]()
經(jīng)過 3-4 小時的運行,悟空構(gòu)建了完整的框架與細節(jié)。
![]()
![]()
![]()
核心功能方面,悟空按需求實現(xiàn)了 TF-IDF+LogReg 傳統(tǒng)機器學(xué)習(xí)路線和 BERT fine-tuning 深度學(xué)習(xí)路線,覆蓋了不同計算資源場景,而且從數(shù)據(jù)下載、讀取、清洗、劃分、訓(xùn)練到評估的全流程閉環(huán),形成了可復(fù)現(xiàn)的 ML pipeline。
工程化交付同樣規(guī)范。通過 train.py 和 evaluate.py 提供統(tǒng)一入口,符合 Python 項目慣例。實驗結(jié)果表格結(jié)合模型優(yōu)劣分析的結(jié)構(gòu)化輸出,更展現(xiàn)了 MiMo V2 Pro 的能力不止于跑通代碼,更在于解釋結(jié)果。
另一項測試任務(wù)是多 Agent 的協(xié)同科研。
我們要求五個 Agent 協(xié)同完成一個小型科研項目,項目主題為“面向垂直領(lǐng)域 LLM 的輕量化蒸餾研究”,任務(wù)內(nèi)容覆蓋了從課題立項到可投稿初稿的完整閉環(huán)。這一任務(wù)旨在考察 OpenClaw 場景下 MiMo V2 Pro 的智能體協(xié)作能力。
![]()
![]()
值得注意的是,收到具體分工之后,MiMo V2 Pro 并未直接輸出結(jié)果,而是進行即時的角色分離,讓每個 Agent 都根據(jù)自身角色明確了輸入依賴和輸出產(chǎn)物。其中唐僧的輸出會成為另外四個 Agent 的輸出,沙僧檢索到的文獻會成為孫悟空實驗設(shè)計的參考,后者又是白龍馬進行 workflow 設(shè)計的依據(jù),最后所有中間結(jié)果都服務(wù)于豬八戒的論文初稿。
這種有向無環(huán)圖式的依賴結(jié)構(gòu)能被模型自動識別,表明 MiMo V2 Pro 不僅對 Agent 的協(xié)作邊界有著清晰的認知,而且真正理解了任務(wù)。
![]()
![]()
可以看到,在任務(wù)第一階段首先由唐僧定義了“醫(yī)療+金融,≤3B小模型蒸餾”的研究目標,沙僧后續(xù)的文獻調(diào)研進一步覆蓋了白盒/黑盒/垂直領(lǐng)域,識別出 DDK、MiniLLM、GKD 等 SOTA 方法。
同時作為協(xié)調(diào)中樞,唐僧后續(xù)還執(zhí)行了兩輪協(xié)作反饋和對中間成果的統(tǒng)一驗收,特別是在任務(wù)的第三階段及時識別出了孫悟空和白龍馬的交付延遲問題,啟動補救機制。
值得注意的是在第二輪協(xié)作反饋中,唐僧提出建議“縮短迭代周期至 3 天 checkpoint”。在經(jīng)歷了孫悟空和白龍馬的拖延之后,表現(xiàn)出了對任務(wù)的迭代復(fù)盤,這是 MiMo V2 Pro 執(zhí)行長程任務(wù)不可或缺的能力。
![]()
MiMo V2 Pro 的編程和工具調(diào)用能力使其非常擅長處理多步驟任務(wù),同時 1M 級的超長上下文設(shè)置,讓該模型在處理具有長代碼需求的架構(gòu)級任務(wù)中更加勝任。這些表現(xiàn),都意味著 MiMo V2 Pro 不是簡單的對話模型,而是為復(fù)雜任務(wù)和開發(fā)場景而生。
兩次交付結(jié)果均水平在線,那么成本如何?
![]()
答案約為一個 Lite 套餐額度的 60%。
02
從訂閱制到流量包,誰動了我的請求次數(shù)
Xiaomi MiMo Token Plan 提供了四檔套餐:
![]()
Lite(中國 ¥39/月,海外 $6/月) —— 0.6億(60M)Credits,可執(zhí)行約 120 個中等~復(fù)雜任務(wù) 。適合剛接觸 AI 開發(fā)的探索者,以一杯咖啡的價格開始。
Standard(中國 ¥99/月,海外 $16/月) —— 2億(200M)Credits,可執(zhí)行約 400 個中等~復(fù)雜任務(wù) 。為日常依賴 AI 提效的辦公與開發(fā)者用戶打造的主力方案。
Pro(中國 ¥329/月,海外 $50/月) —— 7億(700M) Credits,可執(zhí)行約 1400 個中等~復(fù)雜任務(wù) 。面向?qū)?AI 深度嵌入工作流的專業(yè)用戶。
Max(中國 ¥659/月,海外 $100/月) —— 16億(1600M)Credits,可執(zhí)行約 3200 個中等~復(fù)雜任務(wù) 。為全天候高強度使用的開發(fā)者準備,近乎無限制的使用體驗。
這種多檔位套餐、按 Credit 點數(shù)折算 Token 消耗的模式,意味著在傳統(tǒng)“一個會員打包天下”的服務(wù)方案之后,又出現(xiàn)了真正按量計價的 AI 套餐。
但不知道小米有沒有預(yù)料到的是,這種計費模式在應(yīng)用中帶來了全新的困惑:我開的套餐到底能用多久?一次 Coding 任務(wù)會消耗多少 Token?多輪調(diào)試的過程,會不會花光我的所有額度,甚至代碼沒調(diào)試完額度就沒了?
用戶再次想起了被賬單沖擊支配的恐懼。
特別是在 Coding 場景中,不同于一般的對話,多輪調(diào)試、復(fù)制粘貼長代碼、不斷追問與修改的任務(wù)屬性,都會將 Token 消耗量拉到驚人的高度,而這是人腦難以預(yù)估的。至少在追求清晰的預(yù)算管理時,今天的大多數(shù)用戶對 Token 消耗尚不具備可靠的直覺,這難免讓小米的 Token Plan 變成一筆“糊涂賬”。
那么拋開心理因素,小米讓模型更便宜了嗎?
![]()
對比各家廠商面向?qū)I(yè)用戶的 Pro 版本套餐,單一價格維度上,小米在一眾廠商中不占優(yōu)勢。但這個對比的不公平之處在于,用戶為智能付費,各家套餐背后的模型性能卻各不相同。
MiMo V2 Pro 原生支持 1M 上下文窗口,上表的套餐中,只有阿里云百煉的 qwen3.5-plus 和 qwen3-coder-plus 達到了這一水平,其余模型上下文窗口多限制在 256K 以下。
小米對 MiMo 的定位是"面向 Agent 時代的旗艦基座模型"。顯而易見的是,Agent 在多輪規(guī)劃任務(wù)中保留歷史對話時,累計 Token 會迅速增長,每次調(diào)用工具的返回結(jié)果也會追加到上下文中,而長鏈推理本身又是另一個 Token 消耗大戶。
在這一場景下,Credit 和 Token 的換算,更像是支持用戶為上下文窗口本身付費,將 1M 的超長上下文從成本負擔變成價值錨點。作為 MiMo-V2-Pro 的核心能力,這正是其在生產(chǎn)環(huán)境中的差異化價值所在。便宜與否,取決于任務(wù)場景。
而值得注意的是,雖然小米是 Token “流量包”的首創(chuàng)者,但今天更常見的訂閱制也并非無限 Token。
除了單次任務(wù)中,模型上下文窗口的硬性技術(shù)限制之外,用戶還面臨著隱性的經(jīng)濟約束機制。此前就曾有用戶反映稱,火山方舟 Coding Plan 標稱配額為每 5 小時 6,000 次請求,但實際會根據(jù)單次請求的 Token 消耗量折算為多次請求,且不同模型的隱藏倍率不同。
火山的回應(yīng)則是,“通常一次用戶提問會觸發(fā)多次模型調(diào)用,且每次模型調(diào)用均會計入一次額度消耗,因此實際消耗的請求次數(shù)一般會多于用戶提問次數(shù)。”
阿里云百煉的 Coding Plan 也存在類似的限制,當輸入超出允許長度時模型會返回報錯信息,官方推薦的解決方案是精簡輸入或切換上下文窗口更長的模型。
算力成本壓力讓 Coding Plan 沒辦法真正實現(xiàn)無論 Token 消耗的計費模式,因而在計算請求次數(shù)時,會對超長上下文的任務(wù)適用懲罰倍數(shù)。如果說面對小米的 Token Plan 時,大多數(shù)用戶還沒有養(yǎng)成估算任務(wù) Token 消耗量的直覺,那么 Coding Plan 也只是用模型調(diào)用次數(shù)“預(yù)估值”的表述模糊了爭議地帶。
Token 的價格,一直都寫在賬單里。
03
Token 計費的生態(tài)邏輯
從 2026 年初的漲價潮,到小米率先直接根據(jù)消耗量計費,Token 的定價邏輯正在悄然轉(zhuǎn)變。
此前更常見的是訂閱制,一次性收費將按量計費的連續(xù)博弈過程變成單次博弈,用戶覺得自己不是時時刻刻在花錢,預(yù)算也不會超額,但算力成本讓這種方案的現(xiàn)金流未必能夠打正。
神經(jīng)計算引擎創(chuàng)業(yè)者梅一凡表示,在這一視角下,OpenAI、Anthropic 采用的混合計費方案成為了一種非常明智的選擇,即訂閱制基礎(chǔ)上,超量部分按 Token 計費,前者降低用戶心智成本,后者保障單位經(jīng)濟回正。
小米的 Token Plan 本身更像一個帶有封頂機制的 API Plan,但主流模型廠商同樣可以照搬,核心問題仍然是模型強度和成本。
但小米策略的不同之處在于,小米生態(tài)和用戶數(shù)據(jù)構(gòu)成了天然的護城河,這是 MiMo 模型的巨大應(yīng)用空間。因此在戰(zhàn)略上,小米 Token Plan 背后更統(tǒng)一的計費方式,或許是一個內(nèi)部“人車家全生態(tài)”準備進一步發(fā)力的信號。
也許在小米設(shè)想的未來中,所有接入自家生態(tài)的 AI 功能,都會遇到統(tǒng)一的計費方案。那么 Xiaomi MiMo Token Plan 的真正意義,就是邁向這個未來的第一步。
模型層之爭進入下半場,更多廠商動態(tài),歡迎添加作者微信 LIFACAI_888 進一步探討。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.