今天,火山引擎公布了一個數據,豆包大模型日均 Token 使用量突破 120 萬億。
三個月前,這個數字是 60 萬億。2024 年 5 月豆包大模型剛發布的時候,是現在的千分之一。
120 萬億 Token 是什么概念?
按 3 月國內主流大模型約 2-4 元/百萬 Token 的輸入價格粗算,這意味著每天有 3 到 5 億元在 GPU 上燃燒。一年下來就是千億級支出,相當于燒掉網易一整年的營收(網易 2025 年全年凈收入 1126 億元)。而這只是一家公司、一個模型平臺、一天的量。
![]()
這個數字放在更大的盤子里看更有意思。
3 月 23 日,中國發展高層論壇 2026 年年會披露:今年 3 月,中國日均 Token 調用量突破 140 萬億,對比 2024 年初的 1000 億,兩年增長超千倍。同月,中國 AI 大模型周 Token 調用量連續三周超越美國。OpenRouter 數據顯示,3 月第三周全球 AI 大模型總調用量 20.4 萬億 Token,中國占了 7.359 萬億,全球份額 36%。
晚點 LatePost 此前報道過另一個細節:全球日均 Token 消耗量超過 100 萬億的公司,只有三家。OpenAI,Google,字節跳動。
更值得琢磨的是,OpenAI 和 Google 的 Token 消耗來自全球市場,而字節跳動的主要來自中國。一個以國內市場為主的平臺,Token 吞吐量已經和兩個全球化巨頭平起平坐。海外部分還在爬坡。
火山引擎總裁譚待拆解了增長背后的兩個引擎:AI 視頻創作爆發,AI 智能體加速普及。這兩件事在過去三個月同時「人傳人」了。
![]()
火山引擎總裁 譚待
龍蝦來了,Token 的燒法變了
OpenClaw 爆火之后,所有人都在談 Agent。一只「龍蝦」讓整個行業意識到:Agent 時代的 Token 消耗邏輯跟聊天時代完全不同。
以前你跟大模型對話,一問一答,幾百個 Token 就夠。現在一個 Agent 要自己思考、規劃、調工具、檢查結果、出錯了還得自我糾正,一個復雜任務跑下來,Token 消耗是普通對話的幾十甚至上百倍。
火山引擎自己的 ArkClaw 就是個縮影。秒級配對飛書,微信、釘釘、微博也能接入,升級了網盤做端云協同。每一個「自動」的背后,都是 Token 在高速流轉。
譚待提了一個判斷:企業用好 Agent 的關鍵是三件事,模型、安全、技能(Skills)。
![]()
模型是 Agent 的大腦,今年 2 月發布的豆包大模型 2.0 在視覺理解上已經躋身全球第一梯隊,國內第一。安全是底線,火山引擎剛拿下信通院「智能助理智能體產品可信能力認證」和「安全防護產品有效性認證」雙認證,國內唯一。
但光有聰明的腦子和安全的籠子還不夠,Agent 得有手有腳,能干活。Skills 生態的廣度直接決定了 Agent 能力的天花板。
這也是當天另一個重磅消息的背景:OpenClaw 創始人 Peter Steinberger 和火山引擎共同宣布,雙方共建的 ClawHub 中國鏡像站(mirror-cn.clawhub.com)正式啟動運營。
之前國內開發者用 ClawHub 上的 Skills,經常遇到訪問慢、不穩定的問題。鏡像站解決的就是這個痛點:高頻訪問不再卡,Skills 更新能及時同步。Peter Steinberger 甚至在發布現場用「龍蝦」生成了一段視頻來宣布這個消息。
在火山引擎平臺上,累計 Token 使用量超過一萬億的企業客戶,已經從去年底的 100 家增長到 140 家。三個月多了 40 家「萬億俱樂部」成員。
Seedance 2.0 開放公測:企業級視頻生成有了「安全底座」
同一天,火山引擎還宣布Seedance 2.0 面向企業用戶正式開放 API 公測。
Seedance 2.0 是視頻生成領域的全球 SOTA 模型,但讓它對企業真正可用的,不只是生成質量。
火山引擎為它建了一套覆蓋全流程的肖像與版權安全標準,從輸入素材的合規校驗,到生成過程中的肖像權保護,再到輸出內容的版權風險攔截。Deepfake、侵權這些讓企業法務部夜不能寐的問題,在模型層就做了攔截。
![]()
這套安全機制覆蓋視頻生成涉及的各種模態和創作前后的全部環節。說白了,火山引擎選擇在模型最火的時候,先把安全門焊死,再把 API 鑰匙交給企業。
對企業來說,這解決的是一個很現實的問題:敢用。 品牌廣告、電商視頻、營銷物料,這些場景對版權和肖像的敏感度極高。沒有安全兜底,性能再強企業也不敢大規模接入。
譚待描述了企業 Agent 建設的兩條路徑:敏態和穩態。 敏態 Agent 像 ArkClaw,是員工的「創新試驗場」,讓每個 HR 變成更好的 HR,讓每個分析師變成更好的分析師。穩態 Agent 則把驗證過的最佳實踐流程化、規模化,嵌進合同交易、生產管理這些容不得幻覺的場景。
兩條線不是二選一,是一個飛輪:個體創新在 ArkClaw 里激發,沉淀到 HiAgent 變成組織能力,再通過 Skill 和 API 反哺給每個一線員工。
120 萬億背后, Token 工廠崛起
黃仁勛最近定了個調,到 2027 年,全球計算需求將突破 1 萬億美元。他說 Token 是新時代的基礎貨幣,數據中心不再是存儲文件的倉庫,而是生產 Token 的工廠。
![]()
那么,誰在為這些 Token 買單?
火山引擎平臺上,累計調用量破萬億的企業客戶已經有 140 家。這個數字換個角度理解:AI 的成本結構,正在變成實時計費。并且 Token 的價格,也在暴漲。
智譜一個月內兩次調價,GLM-5-Turbo 漲 20%,GLM Coding Plan 中國區漲 30%、海外漲超 100%,一季度 API 整體定價較上一代提升 83%。智譜 CEO 張鵬在業績說明會上說了一句意味深長的話:漲了 83%,調用量還是增長了 400%,供不應求。
此外,3 月 18 日同一天,阿里云和百度智能云同時發布漲價公告,AI 算力產品上調 5%-30%,存儲漲 30%。騰訊云更早一步,3 月 13 日就調整了智能體開發平臺的計費策略,部分模型漲幅超過 4 倍。
![]()
再往前看,亞馬遜 AWS 1 月對機器學習容量塊漲價 15%,谷歌云也在同期悄悄調高了數據傳輸服務價格。
國內三大云巨頭加上海外兩大巨頭,在同一個季度里集體漲價,不是偶然。有人算過一筆賬:OpenClaw 用戶的單日人均 Token 消耗量是傳統聊天用戶的 20-50 倍。
當海量用戶同時把 Agent 跑起來,需求端的增速遠遠跑在了供給端前面——GPU 產能、電力、數據中心,都需要夯實基礎。
黃仁勛說 Token 是基礎貨幣。但貨幣可以存,可以囤,可以等升值。Token 不行。Token 生產出來的那一刻就被消耗掉了,更像電力。
而電力這個詞,從來都不只是技術問題,誰控制了發電和輸電,誰就拿到了定價權。電網要受監管,通信要發牌照。Token 呢?現在還沒有人回答這個問題,但每個廠商都想成為答案。
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.