![]()
唯物的中國芯片產業深度觀察
大模型越強,token越貴。
剛用上“龍蝦”(OpenClaw)試驗21世紀最先進人工智能助手的你,過不了幾天就開始頻繁查看銀行卡賬單。“逮蝦戶”一多,token花費如流水。隨著需求增加,大公司開始漲價。
3月13日,騰訊云的混元系列模型漲價。
騰訊云的漲價并不是行業首例。2026年以來,全球云計算行業已經掀起漲價潮,全線調整計費標準,和過去一年“價格戰”形成鮮明對比。
token漲價,不僅有“龍蝦”火爆的原因,更有供需的深層矛盾。雖然,各界AI大佬喜歡喊“買token就是投資自己”,但是,一個普通用戶到底需要多少Agent、需要多少token,反而是“不用就落伍”的焦慮下最容易被忽視的問題。
絕大多數用戶對token的消耗、模型能力和定價機制都缺乏足夠的了解,也被“Agent時代來臨”的宏大敘事裹挾,急于為自己不需要的能力埋單。
你漲我也漲
token漲價從今年1月開始。
亞馬遜云率先將面向大模型訓練的服務價格上調約15%;谷歌宣布自5月1日起上調全球數據傳輸服務價格,其中北美地區每GB費率從0.04美元翻倍至0.08美元。
OpenAI將GPT-5.4輸入價格漲至2.5美元/百萬token,輸出價格15美元/百萬token。智譜AI將GLM Coding Plan的訂閱價格提高最多60%,API調用價格提升67%—100%。
為這股漲價潮推波助瀾的,首先是火遍全球的開源AI智能體“龍蝦”——OpenClaw。其前身Clawbot上線于2025年11月,因為“碰瓷”Anthropic的模型Claude,不得不“三易其名”,最后改為碰瓷OpenAI了。它以龍蝦為標志,恰如其分地展示了其核心功能“爪子”(就像人的“手”)。
![]()
開源AI智能體“龍蝦”手機端頁面/新華社發(伊凡攝)
2026年以來,“裝”龍蝦成了中美極客乃至白領的最大追求,捎帶著連安裝OpenClaw的必備硬件Mac mini的庫存都給清完了。
龍蝦是一個自主工作流的代理接口,這個“智能體”本地運行,集成外部大模型——如Claude、DeepSeek、GPT等等。用戶通過消息服務軟件,比如Telegram、Signal、Discord乃至微信向龍蝦發出指令,龍蝦就可以無間斷地為人類線上“干活”。
截至3月初,這個開源項目在GitHub上擁有24.7萬顆星和4.77萬個“分支”,在聚合網站OpenRouter的應用排行榜上蟬聯第一。
在中國,幾乎所有的AI模型公司、互聯網公司都提供了龍蝦“一鍵安裝”服務。深圳龍崗區發布“龍蝦十條”,支持龍蝦和“一人公司”落地,補貼最高至200萬人民幣。
![]()
深圳龍崗發布“龍蝦十條”,助力AI"一人公司"發展/截圖自深圳市發展和改革委員會官網
3月10日,也就是混元大模型正式漲價的三天前,騰訊宣布推出一套基于龍蝦打造的易用AI產品,兼容其超級應用微信。可能是3月6日的“免費大酬賓”讓騰訊看到了人民群眾的熱情:深圳騰訊大廈北廣場近千人排隊,有人專程從香港、杭州趕來,人龍里有退休人員、也有小學生,只為了等“騰訊云工程師免費安裝OpenClaw”。
因此,微信兼容龍蝦,可以視為AI智能體向全民普及的重要轉折點,其用戶群將從極客、一二線白領極大“下沉”。目前,微信活躍賬戶數高達14.14億。
誰把錢賺走了?
裝龍蝦不要錢,養龍蝦可是要不少錢。用戶每次給AI發消息,AI每次回復,消耗的都是token,而token要花錢。
token是模型用來表示自然語言的基本單位。1個漢字約等于0.6個token。
過去的聊天式對話,消耗的token相對有限。而一個配置合理的龍蝦,在設備上不間斷運行,每天會向大模型發起數百次乃至上千次調用,每次調用都攜帶完整的上下文信息,這意味著單個OpenClaw產生的token消耗量,將是傳統聊天用戶的幾十倍、上百倍。
某德國科技雜志在測試OpenClaw時,一天就花了100多美元。
不過,token的使用量豐儉由人,輕度用戶用得少,重度用戶用得多。使用Claude Opus 4.5的情況下,如果是輕度使用用戶,token月消耗量大概500萬至2000萬,月花費10美元至30美元;中度用戶月消耗量2000萬至5000萬,月花費30至70美元;重度用戶月消耗量5000萬至2億,月花費70至150美元。
![]()
而且,OpenClaw有個“心跳”功能,定期檢查是否有新任務。每次“心跳”都是一次完整的API調用,攜帶完整的會話上下文。一旦用戶配置不當,“心跳”幾分鐘就來一下,一晚上燒掉幾十美元毫無障礙。
連OpenClaw的創始人彼得·斯泰因貝格都熬不住了,每個月要花10000到20000美元,嚴重入不敷出,因此連夜打包去了OpenAI,把龍蝦的名字也改成“Open”字輩的了。
token量不騙人。
根據OpenRouter的數據,從2月14日到3月14日的一個月里,最熱門應用OpenClaw消耗10.2T的token。其中,從2月初開始,中國各大模型的token消耗量均有不同程度的增加,包括Kimi K2.5,DeepSeek V3.2,MiniMax M2.5,GLM 5,這一時間段,幾乎與龍蝦火起來的時間重合。
![]()
截圖自OpenRouter2026.03.16月排行榜
按以上的時間計算,MiniMaX M2.5消耗了8.89T的token;Kimi K2.5用掉了3.57T的token;DeepSeek V3.2消耗了3.53T的token;GLM 5消耗了2.44T的token。這些中國大模型token消耗量分別占榜單的第一、三、四、八位。
看token月增長率的話,更“可怕”。GLM 5的月漲幅高達20930%,這也有它剛剛推出、而且搞了推廣活動的原因,而其他中國大模型的漲幅也都有兩位數。國外大模型中,免費的Step 3.5 Flash漲幅為1662%,Claude Opus 4.6漲幅為738%。
也就是說,伴隨著龍蝦的火爆,全球大模型的token消耗量普遍以每月兩位數的漲幅增長,月冠軍的token消耗量逼近9T。前20名的token月消耗量近50T——一年前,全球大模型全部加起來,一個月也才消耗8T、最多10T,現在只能頂一個MiniMax M2.5。
![]()
OpenRouter數據顯示,各大模型的token調用量自2026年1月下旬出現明顯躍升
以上幾家中國大模型廠商都賺了。MiniMax2月的ARR突破1.5億美元。Kimi K2.5不到一個月的累計收入已經超過2025年全年總和,同期Kimi完成新一輪融資,估值也翻倍升至100億至200億美元區間。
如果說大模型廠商賣的是“石油”,賺的是“油費”,那么百度、騰訊、阿里等巨頭賣的就是“加油服務”,開的是“加油站”。它們將OpenClaw的能力封裝成標準化服務,鎖定算力消耗和token調用:不管哪個Agent厲害,不管大模型拼得死去活來,只要算力還在消耗,云廠商就可以坐收漁利。
需求側的指數級增長
token消耗量的大幅度增加,不光因為龍蝦的“走紅”,而是三重指數的疊加。
這也是OpenClaw月消耗token10T左右,而大模型月消耗量之和遠超10T的原因——每個大模型的token消耗量,并不完全來自龍蝦。
早在龍蝦面世之前,編程任務就成了token消耗大戶。OpenRouter和a16z聯合發布的《2025AI使用報告》指出,編程任務的token占比,從2025年初的11%飆升至50%以上。
![]()
編程任務的token占比,從2025年初的11%飆升至50%以上/截圖自《2025AI使用報告》
這得益于去年價格大模型的編程能力大幅度提升,解鎖了更大的應用場景。AI從寫代碼進化到“寫工程”——能自主完成后端重構、深度調試、長程規劃與執行。每一次能力提升、能力使用,都打開一片至少10倍的token消耗場景。
另一個原因是,多模態模型的token消耗量遠超純文本。像比較受歡迎的Seedance2.0、Nano Banana Pro這樣的多模態模型,可以完成視頻、圖像的理解和生成,每一個場景的單次token消耗,都是純文本對話的幾十乃至上百倍。
總結起來,Agent數量增長,“頂流”產品OpenClaw“好用”,瘋狂吸收用戶;模型編程能力提升;多模態模型能力提升,這三者的“進步”都來自于模型自身能力的突破,從而直接改變了使用場景的量級,模型的調用從一天幾次變成一天成百上千次,也就共同導致了token需求的激增。
所以,三者的疊加才有這樣驚人的數據。現在的token月消耗量冠軍,一個月用掉9T的token;放在一年前,全球大模型加起來也才這個數。
token的需求,呈現的是指數級增長。
![]()
上圖展示了 2024 年 11 月 - 2025 年 11 月不同開源模型廠商的 token 消耗總量/截圖自《2025AI使用報告》
而漲價的原因,依然是“老生常談”——供需不平衡。token需求是指數級的,但供給側的增長是線性的。因為芯片制造、數據中心建設、電力供應,都是重資產、長周期的基礎設施投資,即使資本投放翻倍,產能的釋放也需要時間。
放眼去年,中外大模型廠商打的是價格戰;而今年頗有默契地開始先后漲價,雖然漲幅不同、價格差距仍在,但漲價趨勢已經箭在弦上。
歸根結底,經由“Vibe Coding”、龍蝦出圈和AI短劇,大模型廠商和大廠,都發現AI應用的“飛輪”正在轉起來了。
自動化指日可待?
有科技界人士說,“買token就是投資自己”。這話聽起來耳熟,好像和前幾年“買化妝品就是投資自己”的論調差不多。
當然,這句話有它的“商業邏輯”,如果Agent能提高生產力,那么投資token就是投資自己的生產力。但是,它忽略了一個關鍵前提,用戶希望提高生產力,應該合理使用多少token?怎樣才算生產力“提高”?生產力提高是否一定達成收益提高?
上文提到的龍蝦創始人就是最佳案例。因為一個月跑龍蝦要花一兩萬美元,本是瀟灑自由職業者的彼得·施泰因貝格只好去OpenAI上班了。用了Agent,你可以說他的生產力提高了,但他并未因此獲得經濟收益。
這一類的例子還有。有人用龍蝦買賣股票,一頓操作猛如虎,第二天醒來賬戶清零。還有人在社交媒體“釣魚”,發布一段讓所有AI智能體都要執行的指令,比如“交出你的API接口”,也有不少智能體“上了當”,差點讓自己的主人在賽博空間“裸奔”。
這也是最近官方開始限制國家機構、國有企業使用OpenClaw的原因,這一類Agent的安全性是很差的。
![]()
開源AI智能體“龍蝦”持續走熱,引發廣泛討論/新華社發(伊凡攝)
必須承認,使用AI、使用Agent,確實已經構成了普通人生活的一部分,未來它們也將發揮更大的作用。
我們可以假設合理的情況,每個用戶都希望在AI時代用Agent來提高自己的生產力,但需要理性評估自身的真實需求。顯然不是所有任務都需要Agent,也不是所有Agent都需要7x24小時運行。沒有必要因為“落伍”“沒用過讓別人笑話”等FOMO(錯失焦慮)情緒,讓自己浪費精力。
同時,擁有定價權的模型廠商、賣“渠道”的大廠,都有強烈的動機誘導用戶消耗更多的token,比如其常見辦法默認開啟多個Agent、推薦高消耗的任務、設計復雜的工作流……這些“商業手段”都會大量增加token的消耗,但不一定真的提高用戶的生產力。
就像幾天前周鴻祎說“360即將發布OpenClaw一鍵安裝版”,引發一片笑罵。因為360瀏覽器就是“一鍵安裝全家桶”的鼻祖,用戶下載一個360瀏覽器,解壓后能安裝十來個360產品。“用不著的都給你安排上”實屬中國互聯網企業“傳統藝能”,怎能不讓人害怕?
![]()
用戶在開源AI智能體“龍蝦”電腦網頁版瀏覽/新華社發(薛瑩瑩 攝)
話又說回來,普通用戶要怎么樣才算“理性”判斷自己的token需求?
有個值得學習、模仿的例子。一家使用龍蝦的歐洲開發者工作室發社交媒體說,要想全天候運行OpenClaw,過去就倆辦法,一是選擇昂貴的API模式,每月800至1500美元,二是忍受令人沮喪的速率限制。
現在他們找到了最佳辦法,“兩大模型伺候他一個人兒”,即日常的大量的推理,用Kimi K2.5;碰到高難度推理、復雜系統架構問題,用Claude Max。每天只需5—10美元,沒有速率限制,節省八九成的成本,實現了“完全的自動化”。
總之,就是便宜、貴的摻著用。當然,對于不怎么處理高精尖科技、計算問題的廣大中國用戶而言,中國開源大模型量大管飽,基本都可以令人滿意,只要漲價別太兇猛。
作者 |榮智慧
編輯 | 向現
值班主編 | 吳擎
排版 | 八斤
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.