![]()
大模型開始讓中國云計算行業格局發生變化。
文丨賀乾明
火山引擎團隊最近為一個 “坐標” 感到振奮。
11 月 17 日,國際市場調研機構 Gartner 發布 《AI 應用開發平臺魔力象限》。這份報告中,火山引擎憑借豆包大模型和火山方舟大模型服務平臺,在 “挑戰者” 象限排名第一。在落地能力指標上,火山引擎僅次于 Google、AWS、微軟、IBM 四家海外云計算公司。
![]()
據了解,Gartner 評估的 AI 應用開發平臺,主要是云計算行業常說的 MaaS(模型即服務)平臺。因為毛利高、潛力大,MaaS 是當前各大云計算公司看重的業務方向。
在權威市場調研報告中排名前列,在火山引擎 5 年的發展歷程中并不多見。
2020 年 6 月正式上線以來,比中國云計算同行晚 10 年的火山引擎嘗試各種方向,從數據驅動增長服務到云原生,增長始終緩慢。無論是在行業報告還是市場認知中,火山引擎經常被歸于 “Others”。對于一個被字節寄予厚望的業務來說,無疑是一種煎熬。
直到大模型爆發改變了云計算行業的競爭規則,火山引擎迎來彎道超車的機會。“這幾年 AI 快速普及,我覺得挺幸運的。” 火山引擎總裁譚待今年接受我們訪談時說。
大趨勢對所有參與者都是公平的。過去三年,火山引擎在 AI 領域激進投入,展現出極強的戰斗力。Gartner 之前,也有市場調研機構 IDC 發布數據,2025 年上半年中國公有云大模型服務市場,火山引擎以 49.2 % 的份額占比位居中國第一。
這背后,不僅有火山引擎 “必須贏” 的意愿和戰略決心,也離不開字節體系飽和式的資源投入和能力支撐。
渴望增長的火山引擎,更激進地押注 AI
火山引擎從上線開始,就是字節高層寄予厚望。他們認為,做好火山引擎對字節成為一家優秀的科技公司、保持技術競爭力很重要,把其視為公司戰略級業務。
2021 年,譚待給火山引擎寫了一份商業計劃書,定下千億年收入的目標。在同一年,中國云計算市場的第一名阿里云,年收入也才剛到 600 億。
如何實現這一目標,成為火山引擎團隊的難題。在以 CPU 為算力底座的傳統云計算市場,火山引擎的發展緩慢。他們無論提供字節的增長經驗 “數據驅動增長”,還是押注云計算領域的新方向 “云原生” 服務,都沒能帶來太多收入增長。
云計算是一個先發者占優勢的市場。有需求的客戶早已與頭部的云廠商綁定,數據遷移成本高,業務流程盤根錯節,后來者很難撼動。即便是企業出于分散風險考慮采用 “多云策略”,火山引擎也要面對一長串競爭對手。
而且它還要面臨中國云計算行業的共同難題:平臺依賴的電力、帶寬等基礎設施成本并不受企業自身控制;大量傳統企業出于數據安全、合規或歷史慣性等原因,仍傾向于自建數據中心。
“那是一個存量的市場,增長就是慢。” 火山引擎的管理層判斷,只有技術迭代時,他們才能有迅速增長的空間。他們評估了區塊鏈、元宇宙、AI 等多個技術方向后,決定押注 AI。
AI 的基礎設施依賴 GPU,而不是原有云計算平臺曾大力投入、建立規模優勢的 CPU 芯片。在這個增量市場上,所有的云公司基本在同一條起跑線上。
而且 AI 的爆發也會催生一批新的公司,“它們往往不是云計算領域的傳統客戶”。 在他們看來,這會是一個比肩互聯網、移動互聯網起步的機會,市場上原本的大型云平臺,都是跟著新技術變革發展壯大。
那時云計算行業對 AI 技術發展潛力還沒有形成共識。當時整個行業能夠消耗大量資源的客戶只有少數自研自動駕駛系統的公司,它們也想著自己組建數據中心,給云計算廠商提供的增長空間不大。在 2021 年前后,多數云計算公司都沒有采購太多 GPU,甚至會退單。一直尋求增長空間的火山引擎堅持了下來。
直到 2022 年下半年,火山引擎發現一些大模型創業公司,如 MiniMax、智譜等,開始在火山引擎上訓練大模型,隨后 OpenAI 推出 ChatGPT,他們意識到增長機會可能就要來了。
火山引擎有相對獨特的卡位。一位云計算從業者說,傳統的云計算公司面對大模型技術多少都有包袱,他們的多數收入來自出售虛擬機、存儲等資源,想要朝著新方向迅速發力比較困難。而火山引擎沒有那么多負擔,可以更激進地調整架構,讓它更適應 AI 時代。
而且字節有中國最大的推薦引擎算法模型,在 2022 年就需要把數千張 GPU 做成單一集群訓練模型。火山作為字節的云服務供應商,積累了訓練大規模模型的經驗。
2023 年 4 月,火山引擎舉辦發布會,宣布中國做大模型的公司七成在火山引擎上。兩個月后,火山引擎團隊把過去訓練大模型的套件整合成服務平臺 “火山方舟”,為企業客戶提供大模型精調、推理、評測、部署等服務。
“很多公司選擇火山,不是因為我們有卡,而是因為我們能夠穩定地把模型訓練出來。” 譚待說。
不過到年底,大模型行業的格局就發生了變化。海外開源模型成熟,中國企業從頭自研大模型的熱情開始退卻,直接購買 GPU 算力的客戶大幅減少。有限的客戶也面臨著更激烈的競爭,阿里投資了多家大模型創業公司,一部分投資額度被折算為阿里云算力資源。
與此同時,大模型調用成本下降,企業客戶開發大模型應用的熱情高漲。火山引擎內部達成共識:大模型的算力使用,將從訓練大模型為主轉移到使用大模型(推理)為主。
他們決定重點發力 MaaS 產品,Token 消耗量成為業務發展的核心指標。
我們了解到,火山引擎也調整了銷售團隊的業績考核指標,把銷售 MaaS 產品排在第一位。銷售賣同等價格的 MaaS 產品得到的回報,要比賣傳統云服務更高。明年,火山引擎也會延續這一策略。
字節飽和式投入 AI,火山引擎增長的助力
云計算本質上是體系的比拼,市場上排名靠前的云公司都有龐大的業務體系托舉。
火山引擎成立并不是像 AWS 或者阿里云誕生時那樣,集團要單獨開一個新業務,而是字節的成熟技術外溢。字節高層也希望火山引擎對外提供技術服務獲取收入的同時,也能反過來強化公司的技術能力。
這一定位決定,火山與字節其他業務的組織聯系要比其他云平臺更緊密。“字節做火山一個重要的原則就是技術內外同源。” 譚待說,火山的基礎設施方面就和字節復用一個大團隊,保證體系能夠協調在一起。
因此字節決定 “飽和式投入”AI 時,整個體系的力量都能高效地傳導至火山引擎。火山引擎有專門的團隊參與到 Seed 部門的模型研發中,同時 Seed 部門訓練出來的模型,也是火山引擎對外提供 MaaS 服務的基礎。
在產品側,字節的 Flow 部門開發了從軟件到硬件、覆蓋多個方向 AI 應用,它們都通過火山引擎的 MaaS 平臺調用大模型。字節在抖音、飛書等產品中加入大模型功能時同樣如此。
這讓火山引擎在大模型發展的早期階段就具備了規模效應。火山引擎近期公布,到今年 9 月,豆包大模型的日均使用量超 30 萬億 tokens,已經逼近國外科技巨頭。
不論是訓練大模型還是對外提供服務,都是規模生意。訓練領先的大模型需要投入海量資金。字節跳動的體量和決心,使其能夠招攬一批研究者,并積極采購可用算力,高強度地研發、迭代大模型。
大模型的應用也只有上了規模,才能夠找到更多優化空間,成本才有可能被壓低。2024 年 5 月,火山引擎宣布大幅降低豆包大模型的調用價格,核心語言模型的定價一度比同行低 99.3%,主要的目的就是擴大火山引擎上的大模型使用規模。
“規模大了,服務器多、負載高,天然就對技術有很高的要求,會強迫我們做好各種事情。” 譚待曾說,規模大了后,做優化收益也很大,“ 1 萬臺服務器利用率優化一個點,和 100 萬臺服務器優化一個點,收益差 100 倍。可以組建強大的團隊做得更好。”
字節的飽和式投入 AI ,也讓火山引擎在大模型領域有了垂直優化的空間。美國管理學家克萊頓·克里斯坦森(Clayton Christensen)在提出 “創新者窘境” 理論后,曾在《創新者的解答》中補充:當新技術還不能滿足用戶的主流需求時,那些 “垂直整合”“封閉架構”,能夠掌控關鍵部件的公司,往往能在各個環節榨取性能,從而獲得更大的競爭優勢。
Gartner 的《AI 應用開發平臺魔力象限》也在一定程度上印證了這個理論。在 ChatGPT 爆發之初,Google 是被 OpenAI 和微軟組合沖擊最大的一方。現在從 “落地能力” 和大模型能力來看,Google 排名全球第一。他們能夠迅速反超,除了擁有豐富的技術儲備和頂級研究人員,還在于 Google 能從芯片(TPU)、軟件開發平臺、大模型到全球產品的垂直整合能力。
火山引擎很難像 Google 那樣,在國內做到從芯片到軟件的垂直整合。不過它也憑借字節的 AI 體系盡可能建立了從模型、到平臺再到產品的整合。
譚待說,火山引擎不僅在這個體系中優化技術,也獲得了客戶線索,“很多客戶都會拿著跟豆包(應用)的聊天 Case 找過來,問火山引擎能不能在企業場景中實現類似的效果。”
據火山引擎披露,現在他們的大模型服務已經覆蓋八成頭部咖啡茶飲品牌、九成主流汽車品牌、八成頭部券商、八成系統重要性銀行、七成 985 高校、9 家全球出貨排名前十的手機廠商等。
大模型服務市場規模還小,但讓云計算行業發生變化
Gartner 的 AI 應用開發平臺魔力象限報告只是一個階段總結。如果只是看這個細分市場,規模與整個云計算領域相比仍有巨大差距。
根據市場調研機構 IDC 的報告,2025 年上半年中國 MaaS(模型即服務)市場規模只有 12.9 億元人民幣,但增速達到 421.2%。
“這個事太早期了。” 譚待此前說,他會告訴團隊 “馬拉松才跑 500 米,別取得一點點小成績就滿意了。”
火山引擎也在積極布局新的增長點:Agent(智能體)。今年舉辦的多場發布會上,火山引擎介紹的技術方案幾乎全部圍繞著 Agent。
在譚待看來,過去的云平臺為網頁和 app 設計,其上限是 “全世界所有人的時間總和”。而 Agent 能自動思考、規劃并執行任務,它工作的總時長將遠超 app 時代的天花板,“能創造更大的經濟價值”。
火山引擎積極押注大模型,已經開始推動中國云計算行業的格局發生變化。我們了解到,火山引擎在大模型領域的增長也在帶動其傳統云計算服務。目前火山引擎一定比例的 CPU 算力、數據庫等需求來自大模型客戶。
在譚待的規劃中,當年定下的千億目標,大模型市場會占到一半多,剩下的都會來自存量市場。這意味著,火山引擎也在把 AI 當作撬動存量市場的杠桿。
據了解,火山引擎今年的收入目標是突破 200 億元人民幣,同比增長超過 100%。這個體量與行業頭部云廠商年收入千億元的規模還有差距,但它也是一個信號:火山引擎不只是 Gartner 細分領域報告中的挑戰者,也正在成為中國云計算領域的挑戰者。
不過頭部的云計算公司同樣在 MaaS 方向上發力,它們正在利用過去積累的存量客戶、企業端的銷售經驗等,把 AI 能力集成到客戶已有的云服務中。火山引擎的發展,也會是一場艱難的攻堅戰。
題圖來源:Top Gun: Maverick
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.