120萬億。
這是豆包大模型現(xiàn)在的日均Token消耗量,在全球范圍僅次于OpenAI和谷歌。三個(gè)月前,這個(gè)數(shù)字還是63萬億,過個(gè)春節(jié)翻了一倍,如果時(shí)間線放到兩年前,增速是一千倍。
也無怪乎沒人再討論AI泡沫,在Token消耗量那條急速上昂的曲線面前,對大模型需求的一切質(zhì)疑都顯得不合時(shí)宜,2026年是產(chǎn)業(yè)的“Token共識(shí)之年”,對于火山引擎來說,即是好消息,也是壞消息。
好消息在于,大模型產(chǎn)業(yè)的走向證明了火山引擎戰(zhàn)略的正確性。過去兩到三年,在所有關(guān)于MaaS和Token的產(chǎn)業(yè)敘事中,火山引擎始終是最激進(jìn)的一個(gè),這被解讀為后來者面向先行者的挑戰(zhàn)機(jī)會(huì),盡管其他頭部云廠商或多或少提及MaaS的商業(yè)模式,但是大船掉頭的思維和戰(zhàn)略慣性,導(dǎo)致這些廠商并沒有徹底轉(zhuǎn)向新的Token邏輯。
當(dāng)AI Agent運(yùn)行規(guī)模與任務(wù)復(fù)雜度同步提高,以O(shè)penClaw為代表的各類“龍蝦”智能體產(chǎn)品,極大推升了Token消耗的天花板,加之視頻、音頻等模型的調(diào)用,相較文字對話的Token消耗也有指數(shù)級的增長,因此所有廠商都加大了MaaS商業(yè)模式的投入。
壞消息在于,火山引擎要直面比以往更激烈的競爭,當(dāng)所有廠商都達(dá)成共識(shí),被行業(yè)詬病的Token商業(yè)粘性差、毛利低的問題,也就暴露在直白的商業(yè)競爭之下,甚至可能掀起新一輪的行業(yè)價(jià)格戰(zhàn)。
火山引擎的策略是什么?
![]()
120萬億Token,花在哪了?
火山引擎總裁譚待指出,Token使用量是衡量AI發(fā)展速度的核心指標(biāo),近期豆包大模型使用量高速增長,核心驅(qū)動(dòng)因素是AI視頻創(chuàng)作的爆發(fā)與AI智能體的加速普及。
第一個(gè)是視頻創(chuàng)作的爆發(fā)。Seedance 2.0、Seedream 5.0 lite等多模態(tài)模型的推出,讓視頻創(chuàng)作相關(guān)的Token消耗大幅增長。這不再是某個(gè)特定行業(yè)的需求,而是跨行業(yè)的普適應(yīng)用,所有行業(yè)都有營銷、傳播的需求,視頻內(nèi)容是最好的載體。
在本次大會(huì)上,火山引擎宣布Seedance 2.0 API 面向企業(yè)用戶開放公測。據(jù)介紹,火山引擎為 Seedance 2.0 建立了行業(yè)領(lǐng)先的版權(quán)與肖像安全保障,覆蓋視頻生成涉及的各種模態(tài)和創(chuàng)作前后全流程,對侵權(quán)、深度偽造等行為進(jìn)行檢測和防御,有效保護(hù)版權(quán)方和創(chuàng)作者的權(quán)益。
第二個(gè)是龍蝦類智能體的普及。這個(gè)在一個(gè)月內(nèi)迅速走紅的AI產(chǎn)品,正在改變企業(yè)AI的使用方式。
譚待表示,現(xiàn)在很難把龍蝦帶來的Token消耗歸到某個(gè)特定行業(yè)或場景。一年前大家還會(huì)按行業(yè)劃分AI的應(yīng)用,現(xiàn)在龍蝦的普及,讓每個(gè)員工都能使用,有人用它做招聘,有人用它做市場分析,有人用它處理周報(bào),所以無法單一定義其應(yīng)用場景。
“這也印證了我們的邏輯,AI的發(fā)展既要自上而下,也要自下而上,自下而上就是讓員工都能使用AI,ArkClaw這類產(chǎn)品就非常適合;自上而下則是像HiAgent這類產(chǎn)品,二者結(jié)合能讓企業(yè)的AI創(chuàng)新和轉(zhuǎn)型速度大幅提升。”他補(bǔ)充道。
由此也引出企業(yè)使用AI的兩種方式,譚待認(rèn)為,企業(yè)AI未來會(huì)有敏態(tài)和穩(wěn)態(tài)兩種形態(tài),敏態(tài)以員工為導(dǎo)向,支持廣泛嘗試,比如通過ArkClaw產(chǎn)品,員工能探索招聘等問題的解法,這就是敏態(tài)。
當(dāng)嘗試出有效方法后,可通過HiAgent產(chǎn)品將方法固化,轉(zhuǎn)為穩(wěn)態(tài)業(yè)務(wù)。穩(wěn)態(tài)業(yè)務(wù)能關(guān)注穩(wěn)定性、準(zhǔn)確率和成本問題,還能優(yōu)化路徑、選擇不同尺寸和能力的模型,從而降低成本。
“企業(yè)真正關(guān)注的是端到端完成事情的整體成本,而非單Token成本,若單Token成本低,但用較差的模型需要消耗10倍甚至20倍Token還做不出結(jié)果,只會(huì)造成浪費(fèi)。”譚待說。
Token會(huì)不會(huì)漲價(jià)?
摩根士丹利在3月份研報(bào)中指出,云計(jì)算一直是價(jià)格通縮的行業(yè),規(guī)模越大,成本越低,價(jià)格就越向下。但是,AI時(shí)代正在打破這一范式,一個(gè)前所未有的提價(jià)周期正在醞釀,中國AI云定價(jià)將開啟20年來首次上調(diào)周期。
其同時(shí)也指出,不同于全球市場云廠商已開啟漲價(jià)周期,中國市場具備兩個(gè)獨(dú)有制約因素,一是不同廠商對于市場份額的優(yōu)先級不同,相應(yīng)定價(jià)策略可能壓制行業(yè)整體提價(jià)空間;
二是中國缺乏類似OpenAI這樣對算力需求極度旺盛的獨(dú)立基礎(chǔ)模型提供商,使得供應(yīng)端成本壓力向下游定價(jià)的傳導(dǎo)效率相對弱于美國市場。
談及漲價(jià)話題,譚待的回應(yīng)很直接,首先漲價(jià)只是部分廠商的行為,也有廠商在降價(jià)。更重要的是,Token的價(jià)值不同,價(jià)格自然也不同。“下一代模型能力更強(qiáng),單Token成本理論上會(huì)更貴,但單Token產(chǎn)生的經(jīng)濟(jì)價(jià)值也會(huì)更高。”
此外他還表示,一些場景下Token價(jià)格高,關(guān)鍵不在Token本身貴,而在無效Token消耗太多。“目前龍蝦使用的Tokens,有一大半都是無謂的探索。通過優(yōu)化skill配合、壓縮等方法,能減少這類無謂的投入消耗,成本也會(huì)大幅降低。”
![]()
圖片來自AI生成
三年前沒人用模型,大家只能講模型參數(shù);之后開始講用量,因?yàn)槟P湍芰€有限,能做的案例也比較簡單,當(dāng)時(shí)企業(yè)也在探索如何通過模型賺錢。
現(xiàn)在的趨勢是,不少企業(yè)已經(jīng)找到了用模型創(chuàng)造更大經(jīng)濟(jì)價(jià)值的方法,比如用Seedance 2.0能以低成本、高效率制作內(nèi)容,在廣告營銷、內(nèi)容制作上獲得更多收入。一旦這個(gè)商業(yè)邏輯跑通,企業(yè)對模型的要求就會(huì)轉(zhuǎn)向價(jià)值導(dǎo)向,關(guān)注模型能否創(chuàng)造更大價(jià)值、解決實(shí)際問題,這能推動(dòng)行業(yè)建立正循環(huán),也是企業(yè)現(xiàn)在最核心的關(guān)注點(diǎn)。
近期國內(nèi)阿里云、百度云等廠商先后宣布AI相關(guān)算力產(chǎn)品漲價(jià)公告,火山引擎等廠商則保持價(jià)格不變,反映出不同廠商的策略以及資源儲(chǔ)備不同。
譚待指出,豆包每一代模型的定價(jià)都經(jīng)過精心設(shè)計(jì),定價(jià)后基本保持不變,若結(jié)合模型的智力水平看,單Token的價(jià)格實(shí)際在下降,因?yàn)檐浻布用娴膬?yōu)化一直在推進(jìn),而模型的智力上限卻在持續(xù)提升,看Token價(jià)格,不能拋開模型能力,否則沒有任何意義。
賽博養(yǎng)蝦三要素
龍蝦火了之后,一個(gè)問題困擾著很多企業(yè)客戶:推出龍蝦后,原有工作該如何開展?
譚待提出的敏態(tài)和穩(wěn)態(tài)思路,為這個(gè)問題提供了解決方案。但要讓龍蝦真正在企業(yè)落地,還需要三個(gè)關(guān)鍵要素:模型、安全和Skills。
“模型是核心,決定了智能體能力的上限和下限。”譚待說,豆包2.0針對Agent場景做了很多優(yōu)化,尤其是在VLM能力上,在視覺理解、計(jì)算機(jī)視覺、機(jī)器人視覺方面表現(xiàn)很好。
安全是第二個(gè)要素,也是用戶關(guān)注的核心。隨著OpenClaw使用量的提升,有很多問題,比如沙箱與權(quán)限失控、提示詞注入、Skills插件投毒等安全問題不斷出現(xiàn),實(shí)際上Openclaw有一套安全設(shè)計(jì)的機(jī)制,完全可以通過更好的產(chǎn)品化設(shè)計(jì),和現(xiàn)有安全方案的結(jié)合,盡可能的完善龍蝦的安全機(jī)制。
火山引擎ArkClaw針對Agent權(quán)限管理和Skills全流程安全防護(hù)做了全面升級,也正式通過了信通院有關(guān)“龍蝦”類產(chǎn)品的可信能力認(rèn)和安全防護(hù)產(chǎn)品有效認(rèn)證,是國內(nèi)首家、也是目前唯一一家同時(shí)斬獲這兩項(xiàng)認(rèn)證的廠商。
![]()
第三個(gè)要素是Skills的開放,決定智能體執(zhí)行能力邊界的要素,正在成為各家競爭的焦點(diǎn)。譚待表示,大家使用OpenClaw,核心看中的是其全球開放的生態(tài)。
本次大會(huì)上,火山引擎宣布和OpenClaw共建“ClawHub中國鏡像站”,而非做私有的生態(tài)。通過中國官方鏡像網(wǎng)站,開發(fā)者可以提供更友好的使用體驗(yàn),不用擔(dān)心高頻訪問源站即時(shí)性和穩(wěn)定性問題。
談及龍蝦這條路線是否是AGI過程中的真正轉(zhuǎn)折點(diǎn),還是可能在半年甚至一年后被更先進(jìn)的方式取代,譚待給出了一個(gè)類比:
”電腦是偉大的發(fā)明,但軟盤在電腦發(fā)展史上的地位,很難定義是轉(zhuǎn)折點(diǎn)還是階段性產(chǎn)物。OpenClaw的相關(guān)技術(shù)對行業(yè)產(chǎn)生了巨大影響,但未來到了AGI時(shí)代,再回看它的定位,是像軟盤一樣的階段性產(chǎn)物,還是有更高的地位,現(xiàn)在很難判斷。”
一年前,譚待曾用馬拉松作比喻,AI行業(yè)大概跑了500米,現(xiàn)在,他判斷這個(gè)距離變成了一公里。
“判斷行業(yè)階段可以用終局來倒推,目前OpenAI、Anthropic等企業(yè)的收入是已知的,全球行業(yè)收入大概是這些企業(yè)收入的三倍,結(jié)合對未來收入的想象空間,就能判斷行業(yè)的發(fā)展進(jìn)度。”(本文作者 | 張帥,編輯 | 楊林)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.