![]()
機器之心編輯部
Agent 時代,我們需要正確的計費和工程設計哲學,這是 Xiaomi MiMo 大模型負責人羅福莉剛剛在 X 上發表的觀點。
![]()
前兩天,我們報道了一則消息 ——Anthropic 宣布,即日起,Claude Pro 和 Max 訂閱用戶,不得再將訂閱額度用于 OpenClaw 等第三方 Agent 框架。想繼續用?那就必須切換到按用量付費的 API。這讓很多用訂閱模式玩「龍蝦」的 Claude 用戶瞬間懵了。
Anthropic 官方解釋稱,訂閱制的定價模型原本是基于「個人用戶正常使用強度」設計的,但 OpenClaw 這類自動化代理工具的使用強度遠超預期 —— 有重度用戶每月僅支付 200 刀訂閱費,卻消耗了價值 5000 刀的算力資源,給 Anthropic 帶來巨大成本壓力。
消息一出,各方反應不一,有人大呼「被背刺」,覺得訂閱模式瞬間失去了吸引力;也有人拍手叫好,認為這是在清理低效使用,保護整個平臺的可持續性。
無論哪種聲音,核心問題都暴露了出來:現在的 token 計費模式已經很難應對挑戰,我們需要更聰明、更可持續的算力使用方式。
在帖子中,羅福莉首先指出,Anthropic 的訂閱制本來就是虧本在跑。
Claude Code 的訂閱制是一套設計精良的算力均衡分配系統。我的判斷是 —— 它大概率不賺錢,甚至可能在虧錢,除非他們的 API 利潤率有 10-20 倍,但我對此存疑。第三方框架接入造成多大虧損,我沒法精確計算,但我近距離看過 OpenClaw 的 context 管理 —— 寫得很差。一個用戶請求之內,它會觸發多輪低價值的工具調用,每次都作為獨立 API 請求發出,每次都攜帶一個很長的上下文窗口(往往超過 10 萬 token)—— 即便緩存命中,也極度浪費,極端情況下還會拉高其他請求的緩存未命中率。
折算下來,每個用戶請求實際觸發的 API 調用次數,是 Claude Code 自身框架的好幾倍。換算成 API 定價,真實成本大概是訂閱價格的幾十倍。這不是差距 —— 這是一個坑。
對于此次訂閱用戶被切斷的陣痛,她認為,這次陣痛長期來看是有好處的,會倒逼工程進步。
OpenClaw、OpenCode 這類第三方框架仍然可以通過 API 調用 Claude,只是不能再搭訂閱的便車了。短期內,這些 Agent 用戶會很痛 —— 成本輕松跳漲幾十倍。但這種壓力,恰恰是推動這些框架認真改進 context 管理、最大化 prompt 緩存命中率以復用已處理的上下文、削減無效 token 消耗的動力。痛苦終將轉化為工程紀律。
同時,她發出警告,勸大模型公司別盲目價格戰,低價賣 Token 卻放任第三方工具薅羊毛是陷阱。
我想勸大模型廠商們,在沒想清楚如何給 coding 訂閱定價、不至于大出血之前,不要盲目卷到價格底部。把 token 賣得極便宜、同時對第三方框架敞開大門,表面上對用戶友好,實則是個陷阱 ——Anthropic 剛剛從這個陷阱里爬出來。更深的問題在于:如果用戶把時間和精力耗在質量低劣的 Agent 框架上、耗在極不穩定又慢的推理服務上、耗在為降本而縮水的模型上,最后發現還是什么事都做不成 —— 這對用戶體驗和留存都是惡性循環。
接下來,她還介紹了小米最近推出的 MiMo Token Plan,并強調她們「追求的是長期穩定地交付高質量的模型和服務」。
關于 MiMo Token Plan—— 它支持第三方框架接入,按 token 配額計費,邏輯和 Claude 新推出的 extra usage 包一致。因為我們追求的是長期穩定地交付高質量的模型和服務 —— 不是讓你沖動付款,然后棄船而去。
![]()
![]()
她最后指出,當前全球算力供給已經跟不上 Agent 創造的 token 需求。真正的出路不是更便宜的 token,而是協同進化 ——「更省 token 的 Agent 框架」 × 「更強大、更高效的模型」。Anthropic 這次的行動,不管他們是否有意為之,都在把整個生態系統 —— 開源和閉源 —— 往這個方向推。這大概是件好事。
對于羅福莉的觀點,開發者社區反應強烈,并且討論的焦點迅速從「Anthropic 對不對」升級到了幾個更根本的問題:
1、這不是一場定價爭議,而是 AI 經濟學的結構性重寫。
就像羅福莉所說,AI 服務的單位成本,從來就不是由模型單獨決定的,而是由「模型 × 框架 × context 管理」三者疊加決定。Anthropic 這次行動,無意中對 Agent 框架制造了一次自然選擇壓力。
![]()
更有人直接說:Anthropic 此舉真正傳遞的信號是 —— 編排層才是產品,而不僅僅是模型本身。訂閱制與 API 計費之間的張力,不過是這個更深層邏輯的表面癥狀。
![]()
2、別急著罵定價,先看看算力是怎么被燒掉的。
羅福莉說的「算力浪費」,在從業者那里得到了強烈共鳴。有人一針見血:這根本不是「AI 太貴」的問題,而是「算力被糟蹋」的問題 —— 粗糙的框架設計加上龐大的上下文窗口加上不必要的冗余調用,燒掉的錢換不來任何真實產出。
![]()
更深的洞察來自一位開發者,他指出:Claude Code 里對 context 的處理決策,從來不是什么默認參數,而是對「保留什么、丟棄什么、何時壓縮」反復推敲后烘焙進架構里的判斷力。第三方框架缺的不是功能,是這種內置的工程意見。
![]()
另一位開發者則用自身經歷印證了這一點:他上個月花了大量時間清理為客戶搭建的舊編排層里的冗余邏輯,「清理爛攤子,比當初搭的時候費力多了」。
![]()
3、市場淘汰已經開始,但結局未定。
羅福莉認為成本壓力會倒逼框架進化,但開發者們提出了一個更殘酷的問題:第三方框架能不能足夠快地把效率差距補上,讓 API 定價在經濟上仍然說得過去?還是大多數用戶發現成本太慘烈,直接默認回到 Claude Code?
![]()
這兩條路通向截然不同的生態格局。有開發者補充說:框架開發者真正需要的,不是「包含在內」的接入權,而是清晰可預期的 token 配額限制 —— 明確的邊界反而會催生更好的產品行為,模糊的灰色地帶只會制造混亂。
![]()
羅福莉這個帖子是一個非常具有前瞻性的技術演進信號,相關討論也切中了當前 AI 軟件工程的核心痛點。接下來,就看整個市場如何從「粗放燃燒算力」轉向「精細化工程架構」了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.