![]()
像賣流量一樣賣Token,字節的新生意經。
文|《中國企業家》記者 閆俊文
編輯|何伊凡見習編輯|李原
頭圖來源|視覺中國
字節跳動緊緊抓住了AI時代的流量——Token(詞元),就像計算機時代的存儲單位Byte(字節)一樣。也讓Token調用量多寡,成為衡量大模型競爭力、企業需求、商業化落地的重要指標。
字節跳動旗下火山引擎披露,截至2025年12月,豆包大模型日均Token調用量已經超過50萬億,半年內增長200%,比去年同期增長了10倍,在全球僅次于OpenAI和Google。
火山引擎總裁譚待提及,不同于云計算時代的IaaS、PaaS以及SaaS架構,在AI云原生架構中,模型是軟件的核心。大模型能力的持續提升,會解鎖新場景,帶動Token使用量增長。雖然目前火山引擎的Token消耗有相當比例來自于字節的“內循環”,但累計使用上萬億Token的外部客戶已超過100家。
![]()
火山引擎的AI云原生架構 攝影:閆俊文
模型的技術處理能力是Token消耗的基礎。12月18日,火山引擎發布豆包大模型1.8,該模型面向多模態Agent場景進行了定向優化。
Token的消耗大戰,也讓字節更激進地在算力和資本開支上布局。12月23日,《金融時報》報道,字節計劃在2026年豪擲1600億元加碼AI,其中一半預算將用于采購AI芯片——這大概相當于字節2025年凈利潤的四分之一。
在應用端,字節也在極速拉升競爭水位。12月24日,數據顯示:豆包App的DAU(日活用戶)已突破1億大關。同時,豆包的用戶增長、市場推廣費用,也是字節歷史上所有破億DAU產品中花費最低的。
近日據《晚點LatePost》報道,火山引擎將成為2026年中央廣播電視總臺春節聯歡晚會獨家AI云合作伙伴,豆包App也將配合上線多種互動玩法。可以想見,國內AI行業的競爭格局或將很快面臨新一輪改寫。
賣Token,字節拼了
字節Token消耗的快速增長,除了模型能力,很大程度上也倚仗于“鈔能力”之下,字節不惜代價地搶占市場。
金沙江創投董事總經理朱嘯虎在接受采訪時稱,現在一個100萬DAU的產品每天就可以消耗幾百億Token,這個量級很容易做到,增長很快。
2025年下半年以來,火山引擎開啟了“甩賣”模式,AI硬件、AI玩具等高Token消耗產品,均是火山瞄準的重點銷售對象。
一位AI英語學習硬件公司員工告訴《中國企業家》,公司的硬件產品售價200多元。此前,他們曾花數百萬元買了5臺服務器做本地適配,發現算不過來賬。后來發現他們只需要付給火山引擎幾十元,用戶就可以永久調用火山引擎的云端大模型。
據他估算,一個火山引擎用戶一年算力資源成本至少要50~80元。“但現在火山算力資源利用不飽和,只能打折便宜賣給硬件廠商。”
當被問到為什么不選擇阿里云呢?上述人士說:“阿里云產品太多,接口也太多,不如火山簡單。”
另一家AI玩具廠商員工向《中國企業家》透露,用戶買完硬件之后,雖然可以永久免費調用大模型,但用戶不可能一天24小時對話。實際調用Token累積可能不過幾天時間,調用總量很低,這也讓云廠商有利可圖。
為了支持AI玩具和各類AI硬件,火山引擎基于新推出的豆包大模型1.8系列模型,也推出了玩具AI框架、音頻AI框架等開發套件,授權收費形式分為三個月、一年與終身使用不限量。
2025年6月,接入豆包大模型的AIoT產品數量是100萬臺。半年之后,該數據已經增長至600萬臺。
但火山引擎智能算法負責人吳迪透露,他在內部經常跟團隊說,不要把2025年定義為AIoT元年,2026年、2027年可能也不是爆發元年,但每一年都比前一年更加重要、機會更大。比如一個臺燈搭配云端豆包大模型,成本不到100元,但附加值可能會超過專業的課外輔導老師。
在to C端的領先優勢,也被字節不斷向云端反哺。豆包已經是中國用戶量最高的AI原生應用,根據QuestMobile數據:2025年第三季度,豆包的月活躍用戶數為1.72億,超過了DeepSeek等對手。
《中國企業家》注意到,最近,字節跳動正將豆包App的能力以“豆包助手API”形式開放給各大開發者和硬件廠商。目前,該API已經開放了日常溝通、聯網搜索等功能,未來還將陸續推出拍照識圖、實時翻譯等。
![]()
來源:視覺中國
從成本側看,豆包助手API調用價格高于火山引擎的Token消耗價格。其采取“后付費”模式,日常溝通0.1元/次,聯網搜索0.2元/次,邊想邊搜0.5元/次,0.5元的單次調用價格已接近豆包大模型百萬Token的輸入價格。
一位相關人士解釋稱:“賣Token是賣水,但豆包助手API相當于賣飲料,無需企業從零搭建。”豆包助手API打出的口號是“億級用戶驗證效果,企業快速享受穩定、高效的智能服務”。
字節跳動不放過小機會、賺小錢的同時,它亦瞄準大機會。豆包手機最近在市場上掀起軒然大波,也讓字節對手機這個用戶量最大硬件載體的野心昭然若揭。
2025年12月1日,豆包發布豆包手機助手,在中興nubia M153系列手機上,豆包手機助手獲得了操作系統層面的高權限,通過GUI(圖形用戶界面)手段,完成了跨平臺比價、點外賣等任務,但很快遭到了微信、淘寶等超級App的“拉黑”狙擊。
但字節并未停下腳步。12月19日,媒體披露,字節跳動正在推進與vivo、聯想、傳音等硬件廠商開展AI手機的合作,為其設備預裝插件,從而獲得用戶入口。
最大機會在企業端
關于火山引擎每天Token調用量超過50萬億,譚待在接受媒體采訪時表示:企業占了Token調用的80%,個人占20%。而此前云時代,企業和個人用量占比是8.5:1.5,現在AI時代可能是7.5:2.5,“未來可能個人還會再高一點”。
相較于硬件和個人,Agent落地在企業端,Token消耗數量可達數十倍甚至百倍,這也需要更長的上下文處理能力和更強的記憶能力。
火山引擎披露,有超過100家企業在火山引擎上累計Token的使用量超過了1萬億。這個數字已經可與國際對標。2025年10月,OpenAI曾披露Token調用量過萬億的30家客戶(不包括要求匿名的客戶),它們集中在教育、銷售、Coding(編程)等場景。
隨著大模型已經進入應用落地期,Token消耗成為衡量應用規模化的核心指標,已是不爭事實。昆侖萬維董事長方漢告訴《中國企業家》,用Token就是用大模型,程序員占整個公司員工數量三分之二,他們會考核程序員的Token調用量,“用Token少,證明不夠努力”。
但Token消耗更大規模的應用,還要依賴于多模態和Agent的繁榮。而當下,企業落地Agent仍然面臨挑戰。譚待提及,真正能開發好Agent的企業并不多,能運營好,被大規模使用的Agent就更少了,主要挑戰有兩點:
第一,Agent身份與權限管理。在Agent時代,不只要管理人,還要管理Agent、工具和系統之間的關系。
第二,模型的確定性和可解釋性問題。Agent為什么這么決策,失敗發生在哪一步?沒有合理的評估和審計,Agent也難以被企業真正信任。
此外,企業已經存在了大量業務系統、數據庫、消息系統、作業系統,它們是企業的核心資產,但并不是為Agent設計的。如果這些系統不能被Agent安全、可控地調用,企業智能化就只能停留在表面。
“不是模型不夠強,而是缺少為Agent規模化運行而生的基礎設施。”譚待說。
為了解決上述問題,火山引擎在“FORCE原動力大會”上,一口氣發布了數款企業端應用:Trae企業版,支持10萬文件、1.5億行代碼的容量;升級發布企業級Agent平臺Agentkit,和多模態數據湖打通。
以企業應用最廣的AI Coding場景為例,在字節跳動內部,已經有超過九成的工程師在使用Trae輔助開發;以抖音生活服務為例,目前有40%以上的代碼是通過AI生成。
![]()
來源:AI生成
雖然這其中,不免有許多“重復造輪子”的資源浪費。Trae的一位員工透露,為了檢查Trae的結果,“還要給它組建一個內部的知識庫”。但將“Token跳動”的故事講下去,字節已經表明了更堅定的決心。
在成本端,火山引擎推出了“AI節省計劃”。該計劃覆蓋所有按量后付費的大模型產品,通過階梯式折扣,幫助企業最高節省47%的成本。
火山引擎還推出了“方舟協作獎勵計劃”,截至2026年3月31日,參與的企業被贈送最多500萬Token,個人200萬Token。使用第二天,還將發送和采集量相等的有效Token數,消費多少返多少。
阿里云不在意Token嗎?
當火山引擎向硬件以及企業端進發,推銷自己的Token戰略時,一個強勁的對手——阿里云也擋在眼前。2025年下半年開始,究竟如何衡量AI云質量,誰才是AI云廠商第一,一直是業內爭論不休的話題。
一位云服務資深人士向《中國企業家》透露:目前關于AI云市場份額,各家有不同的統計口徑。總體來說,阿里云在包括PaaS、IaaS、MaaS在內的整體營收規模位居第一。火山引擎的優勢則主要集中在MaaS,也就是“模型即產品”市場。
該人士也同時強調,模型質量不能只用Token消耗一個標準來考量。“畢竟一個視頻生成,可能就會消耗百萬Token。而豆包背靠抖音,有大量的視頻創作者。”
2025年9月,阿里云相關員工對《中國企業家》表示:未來Token的消耗量會體現在超長的上下文,其中引用多次工具,跟環境進行多次交互、做多輪推理的能力。“我們更多的精力會放在技術架構創新,包括跟硬件的結合上。”
比起Token調用量,阿里云更強調“有效的Token調用”。9月,阿里云推出了Qwen3-Next系列架構模型,它在20萬Token以上的推理速度更快。
前述員工談及:“今天技術上的很多創新會讓Token的成本下降,但我們希望減少無效的Token量。有的模型很笨,會給你輸出一大堆,但是結果很差,這是我們希望去避免的”。
但最近,在字節的兇猛攻勢下,阿里云大概不能一直如此“佛系”了。
媒體報道,阿里已經著手制定讓Token調用量快速提升的計劃,比如大力推廣C端應用。下半年,阿里先后推出AI助手千問App、靈光、AI健康產品阿福等三款應用。其中千問App公測一周,下載量已突破1000萬次。
硬件也將成為未來的Token消耗大戶。11月底,阿里夸克AI眼鏡開售,3天銷量破3000臺。12月23日,釘釘上線企業級AI Agent硬件——DingTalk Real。從C端應用到B端落地,從硬件到軟件,阿里與字節的Token之爭已經一觸即發。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.