![]()
Token 與 Agent 爆發(fā)帶來(lái)的新機(jī)會(huì)。
文丨高洪浩
編輯丨宋瑋
《晚點(diǎn) LatePost》獨(dú)家獲悉,自今年春節(jié)以來(lái),字節(jié)跳動(dòng)云計(jì)算業(yè)務(wù)火山引擎的豆包大模型日均調(diào)用量已超過(guò) 100 萬(wàn)億 Tokens(詞元),不到兩個(gè)月上漲了超 60%。來(lái)自個(gè)人用戶的 Token 消耗近期也明顯增長(zhǎng)。
據(jù)了解,全球目前只有三家公司的 Token 消耗量超過(guò) 100 萬(wàn)億,分別是 OpenAI、Google 與字節(jié)跳動(dòng)。不過(guò)字節(jié)跳動(dòng)的 Token 消耗主要來(lái)自中國(guó)市場(chǎng),海外市場(chǎng)則在快速增長(zhǎng)階段。
一位火山引擎人士告訴我們,火山目前的增長(zhǎng)還是在一定約束條件下實(shí)現(xiàn)的——字節(jié)跳動(dòng)旗下的視頻生成模型 Seedance 2.0 API 尚未在海外正式上線。
Token 是 AI 理解和生成文本的最小語(yǔ)義處理單元,使用者每一次與大模型的交互(提問(wèn)、生成的代碼、生成的圖片和視頻等),最終都要被拆解成 Token 來(lái)完成運(yùn)算。因此 Token 調(diào)用量成為了衡量 AI 模型活躍度、AI 企業(yè)算力承載力的關(guān)鍵指標(biāo)。
過(guò)去一年里,Claude Code 等編程智能體(Agent)產(chǎn)品的走紅讓許多科技公司進(jìn)一步意識(shí)到了 Token 的重要性——一次智能體任務(wù)往往包含多輪推理、工具調(diào)用和任務(wù)執(zhí)行,Token 消耗通常顯著高于普通 AI 對(duì)話。OpenClaw 則將 Agent 推向了更廣泛的大眾用戶,進(jìn)一步放大了 Token 的價(jià)值。
當(dāng)?shù)貢r(shí)間 3 月 16 日,英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛在英偉達(dá) GPU 技術(shù)大會(huì)(NVIDIA GTC)上稱,Token 將是未來(lái)數(shù)字世界最核心、最值錢的大宗商品;Token 的相關(guān)指標(biāo)(吞吐量、生成速度)將成為全球企業(yè) CEO 追蹤的核心經(jīng)營(yíng)數(shù)據(jù),它的表現(xiàn)會(huì)直接反映在企業(yè)后續(xù)的收入中。
提供 MaaS(模型即服務(wù))業(yè)務(wù)的云廠商是這一輪 Token 大爆發(fā)最大的受益者之一。它們通過(guò)出售模型調(diào)用服務(wù)、推理能力和配套工具獲利;市場(chǎng)對(duì) Token 需求的激增會(huì)直接推高它們的模型調(diào)用量,并帶動(dòng)收入增長(zhǎng)。
2025 年起,圍繞 Token 的 AI 云戰(zhàn)爭(zhēng)已經(jīng)打響。亞馬遜 AWS 管理層在 10 月的財(cái)報(bào)電話會(huì)議披露,長(zhǎng)遠(yuǎn)來(lái)看,MaaS 的收入貢獻(xiàn)將與 EC2(亞馬遜 AWS 的 CPU 和 GPU 計(jì)算實(shí)例業(yè)務(wù),總營(yíng)收占比超過(guò) 30%)不相上下。
阿里云則在 11 月末啟動(dòng)了 “百煉戰(zhàn)役”,目標(biāo)是短期內(nèi)將百煉(阿里云的 MaaS 平臺(tái))Token 調(diào)用規(guī)模提升三倍以上。今年 3 月 16 日,阿里巴巴成立了 Alibaba Token Hub 事業(yè)群,由集團(tuán) CEO 吳泳銘直接帶隊(duì)。
阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光在接受我們的訪談時(shí)曾提到,過(guò)去取得了什么成績(jī)并不重要,下一年增量的 10% 都會(huì)大于上一年的全量。2026 年,阿里云的目標(biāo)是拿下中國(guó) AI 云市場(chǎng)增量的 80%。
《晚點(diǎn) LatePost》獨(dú)家了解到,火山引擎此前曾定下了 2026 年 MaaS 業(yè)務(wù)收入超百億元的目標(biāo),隨著 Seed 2.0、Seedance 2.0 等模型發(fā)布、OpenClaw 持續(xù)爆火,團(tuán)隊(duì)已提升了收入目標(biāo)。就在上一年,火山引擎也曾因這塊業(yè)務(wù)增長(zhǎng)迅猛,兩度上調(diào)收入目標(biāo)。
從邊緣走向競(jìng)爭(zhēng)中心的 MaaS 業(yè)務(wù)
2022 年底,隨著新一輪生成式 AI 浪潮卷起,云廠商迎來(lái)了一個(gè)新的機(jī)會(huì):將大模型封裝成可調(diào)用、可計(jì)費(fèi)的云服務(wù),賣給企業(yè)與開(kāi)發(fā)者,并借此打開(kāi)新的收入來(lái)源。
在早期,國(guó)內(nèi)的幾家頭部云廠商中,只有火山引擎對(duì)于推進(jìn) MaaS 業(yè)務(wù)最為積極,也始終將 MaaS 放在了很高的戰(zhàn)略位置。2024 年,火山引擎甚至調(diào)整了銷售團(tuán)隊(duì)的業(yè)績(jī)考核指標(biāo),把銷售 MaaS 產(chǎn)品排在第一位。銷售賣同等價(jià)格的 MaaS 產(chǎn)品得到的回報(bào),要比賣傳統(tǒng)云服務(wù)更高。
相比阿里、華為與騰訊,字節(jié)在云計(jì)算上起步最晚,很難在傳統(tǒng)的云服務(wù)上突圍,新興的 MaaS 業(yè)務(wù)因而成了它最有可能實(shí)現(xiàn)彎道超車的機(jī)會(huì)——先切入模型服務(wù)市場(chǎng),進(jìn)而拉動(dòng) IaaS、PaaS 以及上層應(yīng)用服務(wù)的增長(zhǎng)。
這在海外已有先例。比如對(duì)微軟的云服務(wù) Azure 來(lái)說(shuō),出售 OpenAI 模型的 API 只是第一步。客戶一旦開(kāi)始把大模型真正接進(jìn)業(yè)務(wù),往往就不只購(gòu)買模型能力本身,還會(huì)繼續(xù)采購(gòu)檢索、數(shù)據(jù)庫(kù)、數(shù)據(jù)平臺(tái)等配套云服務(wù),這將直接提升他們?cè)?Azure 上的整體支出。
推廣 MaaS 業(yè)務(wù)也有助于字節(jié)的大模型能力迭代。一位火山引擎人士告訴我們,模型只有通過(guò) MaaS 進(jìn)入真實(shí)的 B 端場(chǎng)景,團(tuán)隊(duì)才能持續(xù)獲得真實(shí)反饋,比如模型是否被用起來(lái)了、被用在什么場(chǎng)景、哪些地方做得好、哪些地方還不夠好,并據(jù)此優(yōu)化模型效果。
上述火山引擎人士透露,火山引擎很早就通過(guò)與客戶開(kāi)展協(xié)作計(jì)劃意識(shí)到,B 端的企業(yè)客戶會(huì)更多用 AI 來(lái)做長(zhǎng)線程任務(wù),有大量 Agentic Coding(智能體式編程)的需求,這在一定程度上反向推動(dòng)了字節(jié)模型能力的演進(jìn)。
許多傳統(tǒng)的云廠商雖然也很早發(fā)布了自己的 MaaS 業(yè)務(wù),但推進(jìn)的節(jié)奏并不算快。部分原因在于,它們?cè)械氖杖牒徒M織能力,仍主要建立在 CPU 時(shí)代的傳統(tǒng)云計(jì)算生意上,包括 IaaS、數(shù)據(jù)庫(kù)、存儲(chǔ)、網(wǎng)絡(luò)、安全以及各類企業(yè)軟件服務(wù)。大模型帶來(lái)的這套新需求,無(wú)論是底層算力結(jié)構(gòu),還是上層產(chǎn)品形態(tài),都和過(guò)去很不一樣。轉(zhuǎn)型需要時(shí)間。
此外在國(guó)內(nèi)大模型能力相對(duì)有限的階段,全行業(yè)的 Token 消耗規(guī)模還不大且價(jià)格較低——百萬(wàn) Tokens 在一元錢左右,這就導(dǎo)致 MaaS 業(yè)務(wù)的營(yíng)收規(guī)模很小,不被市場(chǎng)所看好。
根據(jù)國(guó)際數(shù)據(jù)公司(IDC)公布的數(shù)據(jù),2024 年中國(guó)整體公有云服務(wù)市場(chǎng)規(guī)模則超過(guò)了 3000 億元,MaaS 市場(chǎng)規(guī)模僅為 7.1 億元。
直到 2025 年初,MaaS 在中國(guó)終于迎來(lái)第一次顯著提速。DeepSeek 的出現(xiàn)讓大模型走出技術(shù)圈,進(jìn)入更廣泛的應(yīng)用場(chǎng)景,越來(lái)越多企業(yè)和開(kāi)發(fā)者開(kāi)始通過(guò)云端調(diào)用模型。
另一個(gè)驅(qū)動(dòng)力是多模態(tài)模型的成熟,生圖、生視頻的需求在快速增長(zhǎng)。一位火山引擎人士回憶,字節(jié)的視頻生成模型 Seedance 1.0 剛上線的時(shí)候,內(nèi)部感覺(jué)它可能還不能很好地被使用在一些特別專業(yè)的創(chuàng)作上。但后來(lái)的實(shí)際情況是,有相當(dāng)多的用戶會(huì)用它來(lái)創(chuàng)作整部漫劇,這極大帶動(dòng)了火山引擎 Token 消耗量的增長(zhǎng)。
國(guó)家數(shù)據(jù)局 2025 年 8 月數(shù)據(jù)顯示,2024 年初中國(guó)日均 Token 消耗量為 1000 億。截至 2025 年 6 月底,中國(guó)日均 Token 消耗量突破 30 萬(wàn)億,一年半時(shí)間增長(zhǎng)了 300 多倍。
MaaS 也開(kāi)始從云服務(wù)行業(yè)的邊緣走向中心。
《財(cái)經(jīng)》曾報(bào)道,2025 年 12 月末,阿里云智能集團(tuán)資深副總裁、公共云事業(yè)部總裁劉偉光在一場(chǎng)小規(guī)模溝通中稱,MaaS 收入在云廠商整體收入的占比,有可能達(dá)到 30% 甚至更高。
我們了解到,火山引擎在大模型領(lǐng)域的增長(zhǎng)也在帶動(dòng)其傳統(tǒng)云計(jì)算服務(wù)。目前火山引擎一定比例的 CPU 算力、數(shù)據(jù)庫(kù)等需求來(lái)自大模型客戶。
Agent 的爆發(fā)帶動(dòng) AI 云市場(chǎng)擴(kuò)容
2025 年 5 月,Anthropic 推出的 Claude Code 在開(kāi)發(fā)者群體與企業(yè)間流行了起來(lái)。它提供了一種全新的服務(wù)——讓 AI 真正進(jìn)入工作流,成為能讀代碼、調(diào)工具、跑任務(wù)的 Agent,從根本上改變了構(gòu)建軟件的方式。
Claude Code 等產(chǎn)品還帶動(dòng)了 Coding Plan 這類面向開(kāi)發(fā)者的付費(fèi)模式開(kāi)始快速成型。它把原本按次、按量調(diào)用的 AI 編程能力,變成了可以高頻使用的服務(wù),進(jìn)一步加快了 Agent 在開(kāi)發(fā)者中的普及,并持續(xù)推高了 Token 消耗。
半導(dǎo)體與算力研究機(jī)構(gòu) SemiAnalysis 估算,目前 GitHub 上約 4% 的公開(kāi)代碼提交(commit)由 Claude Code 完成;按這一趨勢(shì),到 2026 年底,Claude Code 占 GitHub 每日公開(kāi)提交總量的比例可能超過(guò) 20%。
年底,OpenClaw 的出現(xiàn)又將 Agent 帶入到了更廣泛的大眾群體中,Agent 也開(kāi)始從 Coding 走向更廣泛場(chǎng)景,包括搜索資料、處理郵件、撰寫文檔、安排日常事務(wù)。
2026 年初,Agent 風(fēng)潮來(lái)到中國(guó),硅谷此前經(jīng)歷過(guò)的一切又在這里重演了一遍。
最先受益的是幾家 AI 創(chuàng)業(yè)公司。2 月,智譜將面向開(kāi)發(fā)者的 GLM Coding Plan 價(jià)格上調(diào)至少 30%,直接原因便是開(kāi)發(fā)者對(duì) AI 編程工具的需求上升;長(zhǎng)期聚焦 C 端產(chǎn)品的 MiniMax 也在其招股書和第一次財(cái)報(bào)中重點(diǎn)介紹了自己的 Coding Plan 模式。3 月 23 日,MiniMax 宣布將自己的 Coding Plan 升級(jí)為 Token Plan,成為了全球首個(gè)支持全模態(tài)模型的統(tǒng)一訂閱計(jì)劃。
國(guó)內(nèi)的一眾類 OpenClaw 涌現(xiàn)后,Agent 進(jìn)入大眾視野。一位火山引擎人士告訴我們,過(guò)去一個(gè)多月,來(lái)自個(gè)人用戶的 Token 消耗增長(zhǎng)了約 16 倍。
Agent 的普及、Token 的暴漲也在帶動(dòng) MaaS 和 AI 云市場(chǎng)擴(kuò)容。
對(duì)企業(yè)來(lái)說(shuō),通過(guò)公有云調(diào)用(MaaS)是當(dāng)前使用大模型最實(shí)用、也最有效的方式。企業(yè)真正需要的不是自己維護(hù)機(jī)器,而是按 Token 靈活調(diào)用模型能力;同時(shí),大模型迭代極快、不同模型的最佳部署方式又各不相同,只有 MaaS 這類持續(xù)升級(jí)的平臺(tái),才能更快接入新模型,并把背后的部署、適配和運(yùn)維復(fù)雜度一并接住。
繼亞馬遜 AWS、谷歌云年初釋放漲價(jià)信號(hào)后,騰訊云、阿里云、百度智能云密集跟進(jìn),主流云計(jì)算服務(wù)商基本上全都加入漲價(jià)行列。
不過(guò) Agent 時(shí)代對(duì)云廠商帶來(lái)的挑戰(zhàn)也不小。過(guò)去的云平臺(tái)基本都是為 Web、App 場(chǎng)景服務(wù)的,現(xiàn)在則要轉(zhuǎn)向圍繞著 Agent 設(shè)計(jì)。
火山引擎智能算法負(fù)責(zé)人吳迪曾在火山引擎 FORCE 原動(dòng)力大會(huì)上提到,下一代 Agent 應(yīng)用絕不能只停留在探索層面,最終要真正走進(jìn)企業(yè)的生產(chǎn)和業(yè)務(wù)需求里。這就要求 Agent 需要具備三大核心能力,長(zhǎng)期記憶的能力,隨業(yè)務(wù)數(shù)據(jù)變化的自我進(jìn)化能力,以及準(zhǔn)確執(zhí)行多步驟復(fù)雜任務(wù)的能力。
對(duì)任何一家云廠商而言,這注定是一場(chǎng)艱難的攻堅(jiān)戰(zhàn)。“(MaaS)這個(gè)事還太早期了。” 火山引擎總裁譚待此前曾跟我們提到。他也會(huì)告訴團(tuán)隊(duì) “馬拉松才跑 500 米,別取得一點(diǎn)點(diǎn)小成績(jī)就滿意了。”
題圖來(lái)源:《銀翼殺手》
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.