![]()
文:王智遠(yuǎn) | ID:Z201440
今天火山引擎 FORCE 大會。
我雖然沒去上海現(xiàn)場,但在朋友圈,已經(jīng)感受到了「擠不進(jìn)去」的熱度;朋友發(fā)來的照片里,連門口都站滿了人。
上午,聽完直播后,感觸最深的是冷冰冰的數(shù)據(jù):
豆包日均調(diào)用量突破了 50 萬億 tokens,一年漲了 10 倍;這意味著 AI 徹底告別了「文青時代」,進(jìn)入了流水線計件的「重工業(yè)時代」。
01
很多人盯著 50 萬億的數(shù)字流口水,覺得字節(jié)的勝利,其實,你得看透這背后的「潛規(guī)則」
以前企業(yè)用 AI,像去米其林餐廳吃頓大餐,那是偶爾顯擺一下的“奢侈品”;現(xiàn)在日均 50 萬億 tokens 的規(guī)模意味著,AI 已經(jīng)變成了路邊的蘭州拉面,成了天天得吃的“剛需”。
你會發(fā)現(xiàn),已經(jīng)有超過 100 家企業(yè)累計用量過萬億了,這意味著在這些公司里,AI成了流水線上天天「計件干活」的苦力。
但問題是,如果這“拉面”一碗賣幾百塊,誰特么天天吃得起?火山這次干的第一件事,把這筆賬給算到了“地縫”里。
來看看一組市場份額,火山在公有云大模型調(diào)用量的份額已經(jīng)占到了49.2%,相當(dāng)于中國公有云上每產(chǎn)生兩個 tokens,就有一個來自火山。
別看現(xiàn)在各家模型都在卷性能,但市場是會「用腳投票」的;用的人越多,模型調(diào)優(yōu)就越快,成本就壓得越狠,這是一個停不下來的「規(guī)模效應(yīng)」。
為了讓這把火燒得更旺,火山搞了個「AI 節(jié)省計劃」,這邏輯非常「字節(jié)」。
不管你用自家豆包,還是用 DeepSeek 這些外面的開源模型,只要你在火山上跑,所有用量都給你算在一起打階梯折,用得越多,省得越多,最高能省快一半(47%)。
這解決了老板們最大的一個心病:試錯焦慮。
以前你想換個新模型試試,心里得盤算半天,之前錢是不是白花了?現(xiàn)在啟動成本高不高?現(xiàn)在好了,換模型不影響折扣,反正你只要在火山這個場子里玩,我就保你越玩越便宜。
再一個,他們還首創(chuàng)了「按思考長度付費」,這把 AI 的腦力活和體力活分開了,讓每一分錢都花在刀刃上,底層邏輯就一句話:
只有當(dāng)一個 token 的價格低到讓企業(yè)心不疼的時候,AI 才能真正跑進(jìn)煙火人間。
智遠(yuǎn)看那 100 多家「萬億 tokens 俱樂部」的成員就在干這事兒,海底撈讓 AI 當(dāng)用餐管家,華泰證券讓 AI 生成播客,連猿輔導(dǎo)都讓 AI 去批改作業(yè)了,這些是實實在在幫你省人力的「數(shù)字民工」。
可賬算明白了,活兒就一定能干好嗎?智遠(yuǎn)跟很多企業(yè)聊過,他們不差那點 tokens 錢,他們怕「工程大坑」。就好比你有錢買磚頭,但你沒本事讓施工隊在爛泥地上蓋出一棟五星級酒店。
02
那為什么 Agent 總出不了實驗室?有三個扎心的真相:身份權(quán)限搞不清、模型確定性差、還有那堆陳年舊系統(tǒng)的接入成本太高。
這還只是表象,最底層的第一道坑,「算力消耗」的隱形成本能直接把你拖垮。
吳迪在演講里算了一筆極度現(xiàn)實的賬:以前你想在核心業(yè)務(wù)里跑 AI,得自建推理集群,初期投入起碼數(shù)百萬,折騰幾個月才能上線。
更要命的是,業(yè)務(wù)流量是有波峰波谷的,你為了應(yīng)對那點高峰買了一堆昂貴的顯卡,等流量一過,就只能看著它們在那兒白白吃灰。
所以,火山提出了一個新詞:「推理代工」。
你來訓(xùn)練,火山來跑。你只要把加密后的模型傳上去,底層的 GPU 運維、網(wǎng)絡(luò)調(diào)度你全都不用管。火山的算力池子大,能做到分鐘級的算力伸縮。
你的流量藍(lán)線怎么走,它的算力綠線就怎么貼著你長;根據(jù)實測,用這種「云上代工」模式代替自建集群,硬件和運維成本能降下一半,吞吐量還能提升 1.6 倍。
搞定了算力,第二道坑就是「工程化」的爛泥地。
譚待在現(xiàn)場直言:現(xiàn)在大家缺的不是強模型,是為 Agent 規(guī)模化運行而設(shè)計的基礎(chǔ)設(shè)施
你想想,一個 Agent 要進(jìn)入生產(chǎn)環(huán)境,它得知道自己是誰(身份)、能干什么(權(quán)限)、在什么地方干活(環(huán)境);如果你沒法解決這些問題,Agent 在公司系統(tǒng)里永遠(yuǎn)是個「黑戶」,誰敢放權(quán)給它?
為了填平這些坑,火山這次把Agent Kit給徹底翻新了。
你不用糾結(jié)怎么給 Agent 建辦公室(Runtime),也不用擔(dān)心它聊兩句就忘事,因為系統(tǒng)自帶了一個記性極好、反應(yīng)極快的「超級大腦」(Memory)。
最絕的是,以前老古董 CRM 系統(tǒng),Agent 根本聽不懂,現(xiàn)在配個「網(wǎng)關(guān)」就能實現(xiàn)即插即用,直接把老古董翻譯成 Agent 能秒懂的方言。
連「監(jiān)工」的事兒火山都替你想好了。它內(nèi)建了安全護(hù)欄(Guardrail)和實時監(jiān)控(Observability),就是為了防止模型在那兒胡言亂語。
所以,這種「精裝房」模式最直觀的結(jié)果是什么?一句話總結(jié)即:代碼量的斷崖式下跌。
火山現(xiàn)場演示了這次 FORCE 大會的報名和簽到 Agent;如果按老辦法寫,起碼得折騰一兩千行代碼,累死累活還容易崩。
在 Agent Kit 模式下,因為復(fù)雜能力都是開箱即用的,Agent 本身的邏輯代碼只用了50 行,后端串聯(lián)只用了 11 行;加起來一共 61 行代碼,砍掉了 96% 的工作量。
這就是,為什么別人還在實驗室里慢吞吞地搓 Demo,而火山的 Agent 已經(jīng)能出來幫幾千人辦會、簽到、做總結(jié)了。
底座穩(wěn)了,代碼少了,那接下來該看什么了?得看「數(shù)字員工」的智商到底夠不夠。 這次豆包和多模態(tài)都進(jìn)行了升級。
03
智遠(yuǎn)先強調(diào)一點:很多人看模型升級,習(xí)慣盯著榜單上的跑分看;說實話,對于企業(yè)來說,跑分高幾分沒意義,能不能把活兒干成才是唯一的指標(biāo)。
這次豆包沒有拿跑分炫技,底層邏輯非常清晰:它是面向 Agent 場景進(jìn)行定向爆破的。
什么意思呢?
以往我們用 Agent 跑長任務(wù),最怕「斷流」。你想想,一個復(fù)雜的任務(wù)需要調(diào)用十幾次工具,Agent 跑著跑著,上下文窗口就爆了,tokens 滿了,它就開始胡言亂語或者直接斷掉。
為了解決「短路」問題,豆包 1.8 出了一個殺手锏:「智能上下文管理」。根據(jù)你設(shè)定的策略,自動清理掉沒用的歷史信息,只留下最核心的邏輯。
現(xiàn)場演示了一個場景,處理十多個立項報告長任務(wù),傳統(tǒng)模型很快就撞到了天花板,任務(wù)被迫終止;但豆包 1.8 靠著這個策略,tokens 始終控制在安全線內(nèi),穩(wěn)穩(wěn)地把活兒干完了。
這就是從「聰明」到「專業(yè)」的跨越。
在 Tool-use(工具調(diào)用) 和復(fù)雜指令遵循上,豆包 1.8 在全球主流評測集上都拿到了領(lǐng)先的成績,甚至在通用智能體測評中領(lǐng)跑全球。
不僅大腦進(jìn)化了,豆包的「五官」也更靈敏了。
火山這次發(fā)布的視頻生成模型 Seaweed 1.5 Pro,解決了一個行業(yè)公認(rèn)的頑疾:「張口不發(fā)聲」。
以前很多模型生成視頻,畫面很美,配上音效后口型對不上,或者語義不一致;Seaweed 1.5 Pro 做到了原生的音畫同步,能支持多人跨語言對白,四川話、粵語、上海話隨你挑,口型精準(zhǔn)得嚇人。
為什么要卷這個?因為字節(jié)看透了,未來商業(yè)內(nèi)容生產(chǎn)是需要「靈魂」的。
還有一個很有體感的例子:豆包 1.8 能通過低幀率看完一個一小時長的監(jiān)控視頻,然后通過工具精準(zhǔn)定位,幫你找出是誰劃了你的車。
抽象吧?以后誰劃拉你車,問豆包。這種對超長視頻的理解能力,直接讓 AI 從「看熱鬧」變成了「能斷案」。
所以,模型升級的本質(zhì)為了讓 Agent 在真實業(yè)務(wù)場景里,不僅有「智商」,還得有「體力」和「眼力」。
但是,當(dāng)你的 AI 員工既聰明又勤快時,問題又來了:你敢把核心數(shù)據(jù)交給它嗎?企業(yè)數(shù)據(jù)的「信任危機」怎么破?
04
你去問一個企業(yè)老板:要不要用 AI 提效?他肯定點頭。但你問,敢不敢把公司積攢了十年的核心知識庫、財務(wù)報表、合同細(xì)節(jié)全喂給云端的大模型?
他大概率會陷入沉默。
這是所謂的「信任赤字」。中國企業(yè)生意就這樣,很多企業(yè)為了安全,寧愿花大價錢搞私有化部署,哪怕算力利用率低得嚇人,哪怕模型升級慢得像蝸牛。
火山引擎這次也給解決了;他們在現(xiàn)場給出的方案叫 Mars on AICC(機密計算)。
啥意思呢?
底層邏輯在云端服務(wù)器里,給你的數(shù)據(jù)和模型套了一個「隱形保險箱」,通過硬件級別的加密技術(shù)(CPU 和 GPU 內(nèi)存加密),數(shù)據(jù)在傳輸和計算的過程中,除了你,沒有任何人能看到里面的內(nèi)容。
這有什么現(xiàn)實意義?譚代在現(xiàn)場舉了上汽大眾的例子。
他們有 5 萬多份機密的內(nèi)部知識庫,搞私有化,那成本簡直是天文數(shù)字;于是他們直接用了這套機密計算方案,在公有云上跑。 結(jié)果很有意思:
安全感拉滿了,實現(xiàn)了端到端的加密,企業(yè)可以像在私有化環(huán)境里一樣安全地使用云端模型;賬面太好看了,相比于全套私有化方案,這套方案幫上汽大眾節(jié)省了 60% 以上的成本。
這就是智遠(yuǎn)想說的「安全紅利」。以前安全是企業(yè)的「負(fù)重」,你得為了它犧牲效率和金錢;現(xiàn)在通過技術(shù)創(chuàng)新,安全成了 AI 規(guī)模化的「加速器」。
不僅汽車行業(yè),聯(lián)想也在用這套方案搞 AI PC 的機密推理,OPPO 也在搞業(yè)界首款支持機密 AI 推理的智能手機。
當(dāng)AI 員工在云端辦公室里戴著「防窺膜」干活,而且老板手里還攥著唯一的鑰匙時,信任危機才算真正解除了。
賬算清楚了,房子蓋好了,安全也保障了,這個 AI 員工就完美了嗎?也未必;很多企業(yè)發(fā)現(xiàn),AI 員工剛?cè)肼毮翘熳铙@艷,結(jié)果干了一年還是那副老樣子。
05
那怎么讓新Agent越干越聰明呢?火山引擎拿出了兩把鑰匙。
第一把鑰匙,讓 Agent 像人類一樣通過練習(xí)來升級。吳迪在現(xiàn)場分享了一個非常硬核的產(chǎn)品:Serverless RL(強化學(xué)習(xí)平臺)。
火山把它做成了「冰山模式」,復(fù)雜算力調(diào)度、算法框架全沉在水下,用戶在水面上只需要關(guān)注業(yè)務(wù)邏輯、數(shù)據(jù)閉環(huán)和 Reward(獎勵函數(shù))。
抖音客服就靠這個,讓模型模擬真人客戶不斷跟它對話、糾錯。 結(jié)果模型不僅學(xué)會了情緒識別,問題解決率還直接漲了 10 個百分點。
這就是「以賽代練」,讓 Agent 在實戰(zhàn)中從新兵磨成老兵。
第二把鑰匙,讓 Agent 真正懂你的生意。
以前AI 助手只能讀讀文檔,根本碰不到公司商品庫和真實用戶行為;這次,火山深度升級了Viking AI 搜索,把「搜索、推薦、問答」三合一,讓 Agent 真正綁定企業(yè)的核心經(jīng)營數(shù)據(jù)。
比如:服飾零售員工問 AI「下季度發(fā)哪些款」,AI會去分析庫存,對比潮流數(shù)據(jù),直接告訴你,這幾款搜得多但庫存不夠,得趕緊補貨。
這種不僅有智商、更有「業(yè)務(wù)感」的表現(xiàn),才是真正的數(shù)字員工。
當(dāng)然,光有鑰匙還不夠,你還得有個「管家」來盯著這幫 AI 員工。
所以,火山甩出了這次的重頭戲,Hi Agent(企業(yè)智能體工作站)。 其中AgentSphere 預(yù)覽版能幫企業(yè)打造一個統(tǒng)一的 AI 調(diào)度中心,不管財務(wù)、HR 還是產(chǎn)品經(jīng)理,都能在這個空間里協(xié)同辦公。
再加上那個能把豆包最核心的搜索、語音能力全部開放出來的 豆包助手 API,企業(yè)基本上是「開箱即用」。
說白了,火山這次通過Hi Agent、Viking 搜索、強化學(xué)習(xí)平臺這一整套組合拳,給企業(yè)遞上了一份實實在在的 AI 時代「員工入職手冊」。
整場大會聽下來,我最觸動的是微山縣小學(xué)。
通過豆包和 Hi Agent,孩子們能用 AI 畫出怪想法,平均成績提升了 10 分以上。這讓我意識到,AI應(yīng)該是老師手里的教具、老板手邊的助手。
2026 年,火山引擎計劃和 500 家企業(yè)機構(gòu)合作,去推動 Agent 的落地;說實話,火山的方案很有意思:用一個 AI 助理(豆包)去瘋狂練習(xí)、蒸餾出 Agent 的能力,然后,打通企業(yè)老掉牙的傳統(tǒng)軟件。
這讓 Agent 真正長出了手腳,成了能進(jìn)系統(tǒng)、干臟活的數(shù)字員工;再復(fù)用這一切,有意思的行業(yè)解決方案。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.