![]()
撰文 | 雁 秋
編輯 | 李信馬
題圖 |火山引擎原動力大會
不久前,機器人中的“當紅小生”宇樹和智元高價贊助春晚的消息引發眾人一片猜想,然而最后,落槌的居然是字節跳動(以下簡稱“字節”)的火山引擎。
據《晚點獨家》報道,火山引擎將成為2026年央視春晚的獨家AI云合作伙伴。同時,作為智能助手的豆包也將參與其中,配合上線多種互動玩法。
火山引擎為何能脫穎而出,答案可以從前不久的火山引擎Force原動力大會上找到。大會現場,火山引擎總裁譚待公布:截至今年12月,豆包大模型日均Token使用量超50萬億,自發布以來增長471倍,較去年同期增長超過10倍。
增長的驅動力除了字節旗下AI應用的發展之外,還有一批外部客戶:累計使用上萬億Token的超過100家,比全球云計算巨頭AWS還多了一倍。
![]()
結合IDC公布的一組數據,在2025年上半年的模型即服務(MaaS)市場中,火山引擎以37.5%的份額位居中國第一,排在其后的阿里、百度、騰訊分別占比21%、15.5%、4.2%。
誰能想到,五年前字節成立火山引擎的時候,它會變成今天給各行各業“打底”的技術底座。在非常內卷的云計算產業里,字節不僅給自己加了把椅子,而且還坐到了牌桌正中央。
其實在過去,字節在視頻方面的處理能力與云計算基礎設施的對外輸出還是比較扎實的,但并未帶給市場“顛覆性”的經濟價值和用戶增長;相比之下,以豆包大模型為核心的AI能力外溢,則迅速吸引了廣泛關注并催生了活躍的生態。
對此譚待坦言,這主要因為兩個原因。其一,當時尚未進入技術爆發期,技術進步是線性的,屬于效率“增益”;其二,企業服務市場本身節奏慢,To B業務需要長期積累。以豆包大模型為代表的AI能力開放,迅速獲得大量關注,核心在于“趕上了好時機”。
AI大模型是當前明確的技術風口,它扮演著“價值放大器”的角色,能在一兩年內就讓相關技術服務的價值被急劇感知,市場格局和生態也會快速發生變化。“如果風口來了,可能一兩年內變化就會非常大。”譚待強調。
在這一輪由大模型驅動的浪潮中,火山引擎不僅提供了平臺,更通過具體的產品迭代與升級,將技術勢能切實轉化為市場動能。
本次大會火山引擎主要圍繞兩個方面更迭,模型側更新了豆包旗艦模型1.8、以及視頻生成模型Seedance 1.5 pro;圍繞Agent也開展了一系列工具鏈和生態服務,比如企業級AI Agent平臺AgentKit,以及面向Agent運營,發布HiAgent“1+N+X”智能體工作站等。
最值得講講的兩個點,就是豆包大模型1.8和Seedance 1.5 pro。
豆包大模型1.8,直接理解的話,可以把它看作是打造更強的多模態Agent大腦。它在工具調用、復雜指令遵循這些硬核能力上做了定向優化,不僅能聽懂用戶的指令,還能自己規劃步驟,一步一步把活兒干完。
豆包大模型1.8在視頻理解力方面也做出了非常大的升級,單次視頻理解幀數翻倍到1280幀。就是說它不僅能用倍速看完一段視頻,而且迅速抓住重點,還能自動慢放,一幀一幀地去摳細節抓重點。
現場展示了通過豆包大模型1.8快速解析長時段監控視頻,精準定位車輛剮蹭事故過程。在一段長達1小時4分鐘的監控視頻中,豆包大模型采用了一套高效的“分層解析”流程:
快速初篩:首先以低幀率模式對整段長視頻進行快速瀏覽,初步鎖定可能存在異常的時間段。
工具調用:利用“Video Card”等專用視頻分析工具,在初篩的基礎上進一步定位關鍵畫面。
精細分析:對嫌疑片段切換至高幀率模式,進行逐幀精細化分析,最終準確識別出肇事車輛及事故發生的具體時間。
該能力直接針對廣大車主面臨的現實困境——車輛在小區、公共停車場等場所被剮蹭后,因監控視頻時長跨度大、人工查看耗時費力而難以追責。傳統方式可能需要工作人員花費數小時反復查看錄像,而大模型技術可將這一過程縮短至分鐘級,大幅提升效率。
![]()
至于Seedance 1.5 pro音視頻創作模型,則把重點放在了音畫同步、多人多語言對話的能力上,速度都是毫秒級的。在發布會現場,官方特意放出了一個片段,畫面中的人物表情細膩,口型精準對齊,畫面很有電影的質感。
Seedance 1.5 pro不僅能處理中文、英語、西班牙語等多種語言,還能處理好四川話、陜西話等方言,對于想生成本地化內容的創作者來說,這一功能簡直是拉滿沉浸感的利器。
![]()
降本也是火山引擎大模型的關注重點,官方表示Seedance系列將上線“Draft樣片”功能,據說可以節省不少錢。
Draft樣片是做什么的?我們都知道,用AI做視頻很燒錢不說,最痛苦的是生成出的效果和想象中大相徑庭。Draft樣片支持先生成低分辨率樣片進行預覽,如果創作者覺得效果還行,再直接產出作品。官方數據顯示,該功能可提升約65%的整體創作效率,并減少60%的無效成本。
在降本方面,火山引擎還推出了業內首個“AI節省計劃”,該計劃覆蓋所有按量后付費的大模型產品,通過階梯式折扣,可幫助企業最高節省47%的成本。
字節不僅介紹了火山引擎的技術演進方向,更是拉來了近4000m2的場地,多家公司集中展示了基于豆包大模型的端側硬件產品。
DoNews受邀參加,來到現場最直接的感受就是AI落地場景更多了,除了以往常見的C端社交、娛樂賽道之外,B端的汽車、金融、廣告、能源客戶也在不斷增加。
在活動入口處,字節就擺了一排汽車,包括奔馳、奧迪、小米、比亞迪等。按照譚待的說法,中國超過九成的主流車企都是火山引擎的客戶。
![]()
譚待表示,以往即便最頂級的座艙系統也顯得“笨拙”,無法理解用戶的自然語言表達。例如,用戶說“我好熱”,系統無法直接調低空調溫度;用戶說“打開天窗”,若實際意圖是打開遮陽板,系統會因指令字面不符而報錯,導致交互失敗。
但引入大模型之后,新型智能座艙能夠以人類對話的方式理解意圖。用戶說“冷了”,系統會自動調高溫度;說“打開天窗”,即使目標物是遮陽板,系統也能準確理解并執行。這種強大的泛化理解能力,讓交互變得無比順暢。
這種新型交互的核心,是構建一種完全自然的、以Agent為中介的交互模式,這種猶如和人對話的智能、自然、高效的交互體驗,將成為未來所有終端——無論是手機、汽車,還是其他各類設備——的共同標準。
除了汽車,在金融、醫藥、文娛、餐飲、消費等領域,火山引擎也已經開拓成功。2025年,超過100萬企業和個人使用了火山引擎的大模型服務,覆蓋了100多個行業。
頭部證券機構成為推動大模型在金融領域落地的關鍵力量。華泰證券推出的國內首款AI原生交易APP“AI漲樂”,基于火山引擎在背后提供的算力、大模型、智能體工具的支持,可以為投資者提供專業與高時效性的投資信息。
工作人員介紹,“AI漲樂”APP有不同風格的AI投資助手,不但可以聊天互動,還能執行選股、盯盤、下單、提醒等一系列復雜操作。
比如用戶不清楚“買什么”,就可以直接問“今天有什么熱點股”,“AI漲樂”便會提供熱點、連板、主題、資金四大維度的選股工具,盡力滿足各類投資者。至于“何時買”,AI助手會基于用戶事先設定的指標和條件幫你盯盤,實時監測市場信息,有變化也會立刻提醒用戶。
![]()
基于豆包大模型的AI玩具/教育產品,大概率是展區內占比最高的一類。字節旗下AI應用開發平臺扣子Coze與國內AI+機器人品牌靈宇宙合作的全新AI智能體“Yummy”,就吸引了較多的關注。
“Yummy”是個非常聰明的陪伴者,與一板一眼問什么答什么的機械對話不同,“Yummy”具備理解上下文與物理環境的能力,可以通過小方機上的鏡頭識別物體,還能結合歷史、生物學等知識講述如屈原與粽子、奧斯曼帝國等背后的故事。這種交互過程充分展示了什么叫寓教于樂,整個學習過程輕松又自然。
![]()
芙崽是一款以AI大模型為底座的情感陪伴潮玩,外形是一個小巧的毛絨掛件,方便隨身攜帶。有意思的是它主打“長期養成”,通過不斷地交互形成屬于自己的性格,甚至還有自己的MBTI。
![]()
豆神學伴機器人融合了火山引擎RTC技術與豆包大模型,能持續理解孩子的學習習慣,提供個性化輔導,甚至還配備了情緒化表達系統——開心時,翅膀輕顫;困惑時,搖頭晃腦;肯定時,點頭示意。通過更生動、更富情感的方式回應孩子的狀態與情緒。
![]()
無論是為九成主流車企裝上“最強大腦”,還是在金融、文娛、消費等領域催生像“AI漲樂”“Yummy”“芙崽”這樣的新物種,其內核都是同一套邏輯:將大模型的泛化理解與生成能力,轉化為各行各業可感知、可交互、可增長的體驗。
這也是火山引擎原動力大會想要輸出的一則觀點,AI時代,主角其實就是Agent。譚待對于未來有這樣的一種預測:隨著大模型能力向執行層下沉,Agent正在成為新的通用人機交互層,其落地路徑正從應用層加速向硬件終端擴散。
(圖片由DoNews拍攝以及主辦方提供)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.