網易首頁 > 網易號 > 正文申請入駐

龍蝦已瘋，吃不起了

2026-03-17 14:55:51　來源: 南風窗

廣東舉報

分享至

唯物的中國芯片產業深度觀察

大模型越強，token越貴。

剛用上“龍蝦”（OpenClaw）試驗21世紀最先進人工智能助手的你，過不了幾天就開始頻繁查看銀行卡賬單。“逮蝦戶”一多，token花費如流水。隨著需求增加，大公司開始漲價。

3月13日，騰訊云的混元系列模型漲價。

騰訊云的漲價并不是行業首例。2026年以來，全球云計算行業已經掀起漲價潮，全線調整計費標準，和過去一年“價格戰”形成鮮明對比。

token漲價，不僅有“龍蝦”火爆的原因，更有供需的深層矛盾。雖然，各界AI大佬喜歡喊“買token就是投資自己”，但是，一個普通用戶到底需要多少Agent、需要多少token，反而是“不用就落伍”的焦慮下最容易被忽視的問題。

絕大多數用戶對token的消耗、模型能力和定價機制都缺乏足夠的了解，也被“Agent時代來臨”的宏大敘事裹挾，急于為自己不需要的能力埋單。

你漲我也漲

token漲價從今年1月開始。

亞馬遜云率先將面向大模型訓練的服務價格上調約15%；谷歌宣布自5月1日起上調全球數據傳輸服務價格，其中北美地區每GB費率從0.04美元翻倍至0.08美元。

OpenAI將GPT-5.4輸入價格漲至2.5美元/百萬token，輸出價格15美元/百萬token。智譜AI將GLM Coding Plan的訂閱價格提高最多60%，API調用價格提升67%—100%。

為這股漲價潮推波助瀾的，首先是火遍全球的開源AI智能體“龍蝦”——OpenClaw。其前身Clawbot上線于2025年11月，因為“碰瓷”Anthropic的模型Claude，不得不“三易其名”，最后改為碰瓷OpenAI了。它以龍蝦為標志，恰如其分地展示了其核心功能“爪子”（就像人的“手”）。

開源AI智能體“龍蝦”手機端頁面/新華社發（伊凡攝）

2026年以來，“裝”龍蝦成了中美極客乃至白領的最大追求，捎帶著連安裝OpenClaw的必備硬件Mac mini的庫存都給清完了。

龍蝦是一個自主工作流的代理接口，這個“智能體”本地運行，集成外部大模型——如Claude、DeepSeek、GPT等等。用戶通過消息服務軟件，比如Telegram、Signal、Discord乃至微信向龍蝦發出指令，龍蝦就可以無間斷地為人類線上“干活”。

截至3月初，這個開源項目在GitHub上擁有24.7萬顆星和4.77萬個“分支”，在聚合網站OpenRouter的應用排行榜上蟬聯第一。

在中國，幾乎所有的AI模型公司、互聯網公司都提供了龍蝦“一鍵安裝”服務。深圳龍崗區發布“龍蝦十條”，支持龍蝦和“一人公司”落地，補貼最高至200萬人民幣。

深圳龍崗發布“龍蝦十條”，助力AI"一人公司"發展/截圖自深圳市發展和改革委員會官網

3月10日，也就是混元大模型正式漲價的三天前，騰訊宣布推出一套基于龍蝦打造的易用AI產品，兼容其超級應用微信。可能是3月6日的“免費大酬賓”讓騰訊看到了人民群眾的熱情：深圳騰訊大廈北廣場近千人排隊，有人專程從香港、杭州趕來，人龍里有退休人員、也有小學生，只為了等“騰訊云工程師免費安裝OpenClaw”。

因此，微信兼容龍蝦，可以視為AI智能體向全民普及的重要轉折點，其用戶群將從極客、一二線白領極大“下沉”。目前，微信活躍賬戶數高達14.14億。

誰把錢賺走了？

裝龍蝦不要錢，養龍蝦可是要不少錢。用戶每次給AI發消息，AI每次回復，消耗的都是token，而token要花錢。

token是模型用來表示自然語言的基本單位。1個漢字約等于0.6個token。

過去的聊天式對話，消耗的token相對有限。而一個配置合理的龍蝦，在設備上不間斷運行，每天會向大模型發起數百次乃至上千次調用，每次調用都攜帶完整的上下文信息，這意味著單個OpenClaw產生的token消耗量，將是傳統聊天用戶的幾十倍、上百倍。

某德國科技雜志在測試OpenClaw時，一天就花了100多美元。

不過，token的使用量豐儉由人，輕度用戶用得少，重度用戶用得多。使用Claude Opus 4.5的情況下，如果是輕度使用用戶，token月消耗量大概500萬至2000萬，月花費10美元至30美元；中度用戶月消耗量2000萬至5000萬，月花費30至70美元；重度用戶月消耗量5000萬至2億，月花費70至150美元。

而且，OpenClaw有個“心跳”功能，定期檢查是否有新任務。每次“心跳”都是一次完整的API調用，攜帶完整的會話上下文。一旦用戶配置不當，“心跳”幾分鐘就來一下，一晚上燒掉幾十美元毫無障礙。

連OpenClaw的創始人彼得·斯泰因貝格都熬不住了，每個月要花10000到20000美元，嚴重入不敷出，因此連夜打包去了OpenAI，把龍蝦的名字也改成“Open”字輩的了。

token量不騙人。

根據OpenRouter的數據，從2月14日到3月14日的一個月里，最熱門應用OpenClaw消耗10.2T的token。其中，從2月初開始，中國各大模型的token消耗量均有不同程度的增加，包括Kimi K2.5，DeepSeek V3.2，MiniMax M2.5，GLM 5，這一時間段，幾乎與龍蝦火起來的時間重合。

截圖自OpenRouter2026.03.16月排行榜

按以上的時間計算，MiniMaX M2.5消耗了8.89T的token；Kimi K2.5用掉了3.57T的token；DeepSeek V3.2消耗了3.53T的token；GLM 5消耗了2.44T的token。這些中國大模型token消耗量分別占榜單的第一、三、四、八位。

看token月增長率的話，更“可怕”。GLM 5的月漲幅高達20930%，這也有它剛剛推出、而且搞了推廣活動的原因，而其他中國大模型的漲幅也都有兩位數。國外大模型中，免費的Step 3.5 Flash漲幅為1662%，Claude Opus 4.6漲幅為738%。

也就是說，伴隨著龍蝦的火爆，全球大模型的token消耗量普遍以每月兩位數的漲幅增長，月冠軍的token消耗量逼近9T。前20名的token月消耗量近50T——一年前，全球大模型全部加起來，一個月也才消耗8T、最多10T，現在只能頂一個MiniMax M2.5。

OpenRouter數據顯示，各大模型的token調用量自2026年1月下旬出現明顯躍升

以上幾家中國大模型廠商都賺了。MiniMax2月的ARR突破1.5億美元。Kimi K2.5不到一個月的累計收入已經超過2025年全年總和，同期Kimi完成新一輪融資，估值也翻倍升至100億至200億美元區間。

如果說大模型廠商賣的是“石油”，賺的是“油費”，那么百度、騰訊、阿里等巨頭賣的就是“加油服務”，開的是“加油站”。它們將OpenClaw的能力封裝成標準化服務，鎖定算力消耗和token調用：不管哪個Agent厲害，不管大模型拼得死去活來，只要算力還在消耗，云廠商就可以坐收漁利。

需求側的指數級增長

token消耗量的大幅度增加，不光因為龍蝦的“走紅”，而是三重指數的疊加。

這也是OpenClaw月消耗token10T左右，而大模型月消耗量之和遠超10T的原因——每個大模型的token消耗量，并不完全來自龍蝦。

早在龍蝦面世之前，編程任務就成了token消耗大戶。OpenRouter和a16z聯合發布的《2025AI使用報告》指出，編程任務的token占比，從2025年初的11%飆升至50%以上。

編程任務的token占比，從2025年初的11%飆升至50%以上/截圖自《2025AI使用報告》

這得益于去年價格大模型的編程能力大幅度提升，解鎖了更大的應用場景。AI從寫代碼進化到“寫工程”——能自主完成后端重構、深度調試、長程規劃與執行。每一次能力提升、能力使用，都打開一片至少10倍的token消耗場景。

另一個原因是，多模態模型的token消耗量遠超純文本。像比較受歡迎的Seedance2.0、Nano Banana Pro這樣的多模態模型，可以完成視頻、圖像的理解和生成，每一個場景的單次token消耗，都是純文本對話的幾十乃至上百倍。

總結起來，Agent數量增長，“頂流”產品OpenClaw“好用”，瘋狂吸收用戶；模型編程能力提升；多模態模型能力提升，這三者的“進步”都來自于模型自身能力的突破，從而直接改變了使用場景的量級，模型的調用從一天幾次變成一天成百上千次，也就共同導致了token需求的激增。

所以，三者的疊加才有這樣驚人的數據。現在的token月消耗量冠軍，一個月用掉9T的token；放在一年前，全球大模型加起來也才這個數。

token的需求，呈現的是指數級增長。

上圖展示了 2024 年 11 月 - 2025 年 11 月不同開源模型廠商的 token 消耗總量/截圖自《2025AI使用報告》

而漲價的原因，依然是“老生常談”——供需不平衡。token需求是指數級的，但供給側的增長是線性的。因為芯片制造、數據中心建設、電力供應，都是重資產、長周期的基礎設施投資，即使資本投放翻倍，產能的釋放也需要時間。

放眼去年，中外大模型廠商打的是價格戰；而今年頗有默契地開始先后漲價，雖然漲幅不同、價格差距仍在，但漲價趨勢已經箭在弦上。

歸根結底，經由“Vibe Coding”、龍蝦出圈和AI短劇，大模型廠商和大廠，都發現AI應用的“飛輪”正在轉起來了。

自動化指日可待？

有科技界人士說，“買token就是投資自己”。這話聽起來耳熟，好像和前幾年“買化妝品就是投資自己”的論調差不多。

當然，這句話有它的“商業邏輯”，如果Agent能提高生產力，那么投資token就是投資自己的生產力。但是，它忽略了一個關鍵前提，用戶希望提高生產力，應該合理使用多少token？怎樣才算生產力“提高”？生產力提高是否一定達成收益提高？

上文提到的龍蝦創始人就是最佳案例。因為一個月跑龍蝦要花一兩萬美元，本是瀟灑自由職業者的彼得·施泰因貝格只好去OpenAI上班了。用了Agent，你可以說他的生產力提高了，但他并未因此獲得經濟收益。

這一類的例子還有。有人用龍蝦買賣股票，一頓操作猛如虎，第二天醒來賬戶清零。還有人在社交媒體“釣魚”，發布一段讓所有AI智能體都要執行的指令，比如“交出你的API接口”，也有不少智能體“上了當”，差點讓自己的主人在賽博空間“裸奔”。

這也是最近官方開始限制國家機構、國有企業使用OpenClaw的原因，這一類Agent的安全性是很差的。

開源AI智能體“龍蝦”持續走熱，引發廣泛討論/新華社發（伊凡攝）

必須承認，使用AI、使用Agent，確實已經構成了普通人生活的一部分，未來它們也將發揮更大的作用。

我們可以假設合理的情況，每個用戶都希望在AI時代用Agent來提高自己的生產力，但需要理性評估自身的真實需求。顯然不是所有任務都需要Agent，也不是所有Agent都需要7x24小時運行。沒有必要因為“落伍”“沒用過讓別人笑話”等FOMO（錯失焦慮）情緒，讓自己浪費精力。

同時，擁有定價權的模型廠商、賣“渠道”的大廠，都有強烈的動機誘導用戶消耗更多的token，比如其常見辦法默認開啟多個Agent、推薦高消耗的任務、設計復雜的工作流……這些“商業手段”都會大量增加token的消耗，但不一定真的提高用戶的生產力。

就像幾天前周鴻祎說“360即將發布OpenClaw一鍵安裝版”，引發一片笑罵。因為360瀏覽器就是“一鍵安裝全家桶”的鼻祖，用戶下載一個360瀏覽器，解壓后能安裝十來個360產品。“用不著的都給你安排上”實屬中國互聯網企業“傳統藝能”，怎能不讓人害怕？

用戶在開源AI智能體“龍蝦”電腦網頁版瀏覽/新華社發（薛瑩瑩攝）

話又說回來，普通用戶要怎么樣才算“理性”判斷自己的token需求？

有個值得學習、模仿的例子。一家使用龍蝦的歐洲開發者工作室發社交媒體說，要想全天候運行OpenClaw，過去就倆辦法，一是選擇昂貴的API模式，每月800至1500美元，二是忍受令人沮喪的速率限制。

現在他們找到了最佳辦法，“兩大模型伺候他一個人兒”，即日常的大量的推理，用Kimi K2.5；碰到高難度推理、復雜系統架構問題，用Claude Max。每天只需5—10美元，沒有速率限制，節省八九成的成本，實現了“完全的自動化”。

總之，就是便宜、貴的摻著用。當然，對于不怎么處理高精尖科技、計算問題的廣大中國用戶而言，中國開源大模型量大管飽，基本都可以令人滿意，只要漲價別太兇猛。

作者 |榮智慧

編輯 | 向現

值班主編 | 吳擎

排版 | 八斤

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.