記者丨雷晨
編輯丨倪雨晴 金珊 江佩霞 朱益民
國內(nèi)云計算進入“算力通脹”時代。
4月15日,阿里云宣布自7月15日起,DDoS高防(中國內(nèi)地)彈性95費用上調(diào)50%(從每兆瓦月100元漲至150元),這是阿里云一個月內(nèi)第三次調(diào)價。
這一輪全球漲價潮由海外率先引爆——亞馬遜AWS年初率先上調(diào)AI算力價格,谷歌云隨后跟進,最高漲幅達100%。騰訊云、百度智能云也同步跟進。騰訊云4月9日宣布AI算力、容器、EMR全線上調(diào)5%;百度智能云AI算力與存儲上調(diào)5%~30%。
漲價背后最根本的驅動力,是Token消耗的爆發(fā)式增長。國家數(shù)據(jù)局局長劉烈宏在3月24日的國新辦新聞發(fā)布會上披露:“到今年3月,我國日均Token的調(diào)用量已超過140萬億,相比2024年初的1000億增長了1000多倍,相比2024年底的100萬億,三個月時間又增長了40%多。”
對于“Token”,國家數(shù)據(jù)局已正式將其定名為“詞元”。它正從AI技術的計量單位,加速轉變?yōu)橹悄軙r代的產(chǎn)業(yè)“貨幣”,其消耗規(guī)模的激增直接推高了算力需求,進而帶動云計算服務價格上漲。
Token熱度也蔓延到資本市場,去年底登陸港交所的“Token第一股”迅策僅用100天市值突破1000億港元,年內(nèi)漲幅達547%。
![]()
港股云巨頭們近日也迎來股價大反彈,4月16日盤中,百度集團漲超7%,阿里巴巴漲近5%,騰訊控股漲超2%。
![]()
Token消耗激增
OpenClaw是這輪Token需求爆發(fā)的核心因素之一。據(jù)OpenRouter平臺數(shù)據(jù),2026年3月16日至22日當周,平臺接近四分之一的Token消耗由OpenClaw貢獻。另據(jù)國金證券計算機行業(yè)周報,截至2026年3月9日至15日的周度數(shù)據(jù),OpenRouter平臺內(nèi)20%的Token消耗由OpenClaw貢獻,OpenClaw單周Token消耗量已相當于2025年第四季度全平臺周均Token消耗量的60%。
Token消耗量的快速攀升,首先暴露了一個深層矛盾:消耗量增長,并不等同于智能水平同步提升。智能體與傳統(tǒng)Chatbot的業(yè)務邏輯存在本質(zhì)差異。傳統(tǒng)Chatbot遵循用戶提問到模型回答的單輪交互模式,Token消耗與對話輪次呈線性關系。而智能體具備感知、決策、執(zhí)行的閉環(huán)能力,需要自主拆解復雜任務、調(diào)用外部工具、多輪迭代驗證,直至任務完成。這種業(yè)務邏輯的差異,直接導致了Token消耗量的數(shù)量級放大。
這個問題在商業(yè)層面已經(jīng)產(chǎn)生了真實沖突。2026年4月初,Anthropic停止了訂閱用戶通過OpenClaw等第三方工具接入ClaudeAPI的許可。Anthropic官方解釋稱,部分重度用戶每月僅支付200美元訂閱費,卻消耗了價值5000美元的算力資源,給公司帶來巨大成本壓力。一個OpenClaw代理運行一天,消耗的算力成本在1000美元到5000美元之間,受影響用戶需切換至按用量付費的API模式。
商業(yè)模式與智能體算力消耗現(xiàn)實之間的核心矛盾已然爆發(fā)。智能體場景下的Token消耗不可預測,沒有歷史數(shù)據(jù)可以參考,任何固定月費都在對一個無法建模的變量做猜測。問題的根源不在于定價策略本身,而在于Token消耗的底層邏輯正在被智能體技術徹底改寫。
今年3月下旬,火山引擎總裁譚待在接受21世紀經(jīng)濟報道等媒體采訪時也指出,目前探索中的Token有一大半都是無謂的探索。他舉例說,很多用戶反饋智能體產(chǎn)品Token消耗快,核心問題不是單Token貴,而是它完成任務時的大量無效嘗試——為了找到最終解法,超過一半的Token都消耗在探索中。如果單Token成本低但模型能力不足,需要消耗10倍甚至20倍的Token還無法完成任務,最終只會造成更大的浪費。
這標志著,智能體的普及正在以遠超預期的速度消耗算力資源,而現(xiàn)有的計費體系和效率管理機制仍有完善空間。
近期,小米集團MiMo負責人羅福莉在社交平臺發(fā)文指出,從宏觀角度看,全球計算資源增長的腳步已跟不上Agent帶來的Token需求增長。真正的出路不是提供更便宜的Token,而是讓“更高效的Agent框架”ד更強大且更高效的模型”協(xié)同演進。
![]()
算力持續(xù)緊缺
當前,推理正在取代訓練成為算力消耗的主戰(zhàn)場。德勤在2026年1月發(fā)布的《2026科技、傳媒和電信行業(yè)預測》報告中指出,2026年AI推理將占算力三分之二,主要在近5000億美元新數(shù)據(jù)中心及企業(yè)服務器進行。
而推理算力需求占比近七成之后,競爭規(guī)則正在改寫。單Token成本、部署密度、能效比取代單純峰值算力,成為客戶選型的關鍵考量因素。
與此同時,算力供給的結構性缺口正在放大。根據(jù)半導體研究機構SemiAnalysis發(fā)布的數(shù)據(jù),H100一年期租賃合同價格從2025年10月的低點1.70美元/小時/GPU飆升至2026年3月的2.35美元/小時/GPU,漲幅近40%。該指數(shù)基于對100多家云服務商、算力買家與賣家的月度直接調(diào)查構建。盡管價格上漲,相關GPU租賃容量已全部售罄,2026年初尋找新GPU算力資源的難度被比喻為“預訂最后一班航班的機票”,不僅價格高昂且?guī)缀鯚o余量可選。
緊張的并不只有GPU。據(jù)報道,2026年3月下旬,英特爾與AMD相繼通知客戶上調(diào)處理器價格。過去幾個月,CPU作為AI服務器調(diào)度與推理核心被云廠商大量采購,兩大巨頭2026年服務器CPU產(chǎn)能目前已基本售罄。
與此同時,頭部互聯(lián)網(wǎng)公司正在大幅加碼資本支出。財報數(shù)據(jù)顯示,騰訊資本支出在2024年迅速增加到768億元,同比增長221%,2025年進一步增至792億元;阿里巴巴資本支出從2023年244億元增長至2025年的1039億元,突破千億。據(jù)媒體公開報道,字節(jié)跳動2026年資本支出計劃約1600億元,約一半投向AI芯片和數(shù)據(jù)中心。
算力緊張的另一個側面,是中國AI芯片市場格局正在發(fā)生深刻變化。據(jù)IDC數(shù)據(jù),2025年中國市場AI加速卡總出貨量約為400萬張。英偉達出貨約220萬張,市場份額55%;AMD出貨約16萬張,市場份額4%。中國本土廠商合計出貨約165萬張,市場份額約41%。
在中國廠商陣營中,華為處于領先地位。據(jù)IDC數(shù)據(jù),2025年華為出貨約81.2萬顆AI芯片,約占整體市場20%,接近國內(nèi)供應商總出貨的一半。阿里巴巴旗下平頭哥以約26.5萬顆居次,市場份額約7%。百度昆侖芯與寒武紀各約11.6萬顆,并列第三。
中信證券指出,Agent&多模態(tài)等應用爆發(fā)驅動Token調(diào)用量井噴,進而導致國內(nèi)算力荒,國產(chǎn)大模型在推理端積極適配為國產(chǎn)算力廠商帶來加速放量機遇,預計2026年國產(chǎn)算力芯片出貨量至少實現(xiàn)翻倍以上增長,將為算力設計公司、先進制程、先進封裝、先進存儲以及配套產(chǎn)業(yè)鏈帶來強勁增長動能。
本土廠商的崛起,正在逐步改變中國AI芯片市場的供給格局,為緩解算力缺口提供了新的可能。
![]()
商業(yè)模式重構
Token經(jīng)濟的最后一塊拼圖是商業(yè)模式。當Token消耗量從萬億級邁向百萬億級,如何定價、如何收費,直接關系到產(chǎn)業(yè)的商業(yè)閉環(huán)能否跑通。
回顧行業(yè)發(fā)展,2024年下半年至2025年初,中國大模型市場深陷價格戰(zhàn),字節(jié)豆包報價低至0.0008元/千Tokens,智譜自己也曾將GLM-4-Plus大幅降價。
但這一格局在2026年正在發(fā)生根本性變化。智譜成為國產(chǎn)頭部模型廠商中首個在推出新模型的同時,執(zhí)行實質(zhì)性提價的公司。2月發(fā)布GLM-5時,CodingPlan套餐價格上調(diào)30%起,3月發(fā)布GLM-5-Turbo時再漲20%,相對GLM-4.7累計漲幅達83%。
漲價并未抑制需求。據(jù)智譜公開披露,2026年一季度API調(diào)用定價提升了83%,調(diào)用量反而增長400%。智譜MaaSAPI平臺ARR約17億元,在過去12個月提升60倍。截至2026年3月,平臺注冊用戶已突破400萬,覆蓋全球218個國家和地區(qū)。智譜CEO張鵬表示,當模型足夠強,API本身就是最好的商業(yè)模式,定價權是由技術實力以及長期趨勢所帶來的領先地位決定的。
當前,Token計費正成為行業(yè)標準。今年3月,劉烈宏在中國發(fā)展高層論壇年會上指出,一套以詞元(Token)計費為基礎的新型商業(yè)邏輯正在加速演進,圍繞詞元的調(diào)用、分發(fā)與結算,一套新的價值體系正在加速演進形成。
但Token定價面臨的真正難題,不在于收費標準,而在于智能體場景下的Token消耗目前高度不可預測。與電力或鋼鐵等傳統(tǒng)生產(chǎn)要素不同,Token具備獨特的可編程性。英偉達創(chuàng)始人兼CEO黃仁勛在2026年3月的一篇署名文章中,將Token定義為現(xiàn)代AI的基本單位,并指出它同時具有兩種屬性:作為語言,它是計算過程的原子;作為貨幣,它是價值流通的媒介。
譚待在受訪時指出,判斷行業(yè)階段可以用終局倒推——看所有Tokens未來能產(chǎn)生的收入規(guī)模,再對比當前全球行業(yè)的實際收入,可以看出所處位置。目前OpenAI、Anthropic等企業(yè)的收入已知,全球行業(yè)收入大概是這些企業(yè)收入的三倍。
整體來看,AI算力與Token經(jīng)濟仍處于極早期階段,定價機制、效率管理、供給能力等方面,仍有巨大的完善和提升空間。
越聲投研:
(聲明:文章內(nèi)容僅供參考,不構成投資建議。投資者據(jù)此操作,風險自擔。)
SFC
出品丨21財經(jīng)客戶端 21世紀經(jīng)濟報道
微信統(tǒng)籌丨江佩霞 編輯丨金珊
21君薦讀
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.