作者:王聰彬
12月1日,豆包手機開啟小批量發(fā)售,出乎意料的是,市場熱度遠超預(yù)期。
盡管尚未打通各類App的API,但豆包手機助手確實可以說完成了一次突破,通過AI模擬用戶的點擊、滑動等真實操作,直接理解屏幕內(nèi)容并跨應(yīng)用執(zhí)行指令,在一定程度上打破了APP間的“信息孤島”。
17天后,在FORCE原動力大會上,火山引擎發(fā)布了豆包大模型1.8版本,而且還有配備了Agent的各種能力。還有一個消息是萬億Token俱樂部成員突破100家,這一數(shù)字已超過某頭部云服務(wù)商。
在火山引擎總裁譚待看來,模型之間最重要的并不是競爭,而是如何把市場做大。他談到,火山引擎最早提出模型的重要性,最早推動模型降價,通過技術(shù)大幅降低成本,同時還能保持毛利。當時很多人不信,現(xiàn)在更多廠商也在跟進降價策略。
唯有共同做大市場,AI在行業(yè)的落地速度就會越快,帶來的價值與貢獻也將持續(xù)放大。
![]()
火山引擎總裁譚待
日均50萬億 Token、超百家企業(yè)客戶:企業(yè)級AI正在快速規(guī)模化
譚待在現(xiàn)場首先展示了一組數(shù)據(jù):截至今年12月,豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍,自發(fā)布以來增長了417倍。目前已有超過100家企業(yè)客戶累計token使用量超過一萬億。
豆包大模型 1.8 擁有更強的Agent能力,提升了多模態(tài)理解,支持更靈活的上下文管理。
在設(shè)計之初便圍繞多模態(tài)Agent場景進行定向優(yōu)化,在智能體相關(guān)能力上實現(xiàn)系統(tǒng)性增強,比如多輪交互能力、復(fù)雜指令遵循能力以及OS Agent的實際操作能力均有顯著提升。
在多模態(tài)理解層面,豆包大模型1.8對視覺能力進行了底層升級,不僅能夠以低幀率理解超長視頻,還在視頻語義解析、復(fù)雜空間關(guān)系理解以及文檔結(jié)構(gòu)化處理等方面取得明顯進步。
而且豆包大模型1.8原生支持智能上下文管理機制,用戶可通過策略配置,在模型執(zhí)行超長、多步驟任務(wù)時自動清理歷史信息,確保任務(wù)持續(xù)、穩(wěn)定完成。
今年春季FORCE原動力大會,火山引擎首次發(fā)布視頻模型Seedance 1.0。到冬季,Seedance升級至1.5 Pro版本。其采用創(chuàng)新的原生音視頻聯(lián)合生成架構(gòu),支持環(huán)境音、背景音樂、人聲等多種元素,實現(xiàn)了毫秒級的音畫同步輸出。
Seedance 1.5 pro還支持多人跨語對話,可基于畫面中說話角色的數(shù)量與景深信息,實現(xiàn)精準的口型匹配,從而有效解決“張口不發(fā)聲”或口型錯位等常見問題。
可以看到,市面上不少模型雖然實現(xiàn)了音畫同步,但在口型匹配與語義一致性上仍存在明顯不足。Seedance 1.5 Pro 在這兩項關(guān)鍵能力上實現(xiàn)了顯著提升,并原生支持多語言及多種中文方言,包括四川話、粵語、上海話等,進一步拓展了視頻內(nèi)容創(chuàng)作的實用邊界。
在模型定價上,火山引擎推出業(yè)內(nèi)首個“AI節(jié)省計劃”,覆蓋火山引擎上所有按量后付的大模型產(chǎn)品,包括豆包大模型家族及各類第三方開源模型,最高可節(jié)省47%的使用成本。
企業(yè)有了Agent的實踐路徑,穩(wěn)定、可控、可規(guī)模化
隨著大模型智能水平的不斷提升,Agent正逐漸進入企業(yè)的核心業(yè)務(wù),預(yù)見未來兩三年內(nèi),Agent將帶來巨大的生產(chǎn)力革命。
但是企業(yè)面臨的更加直觀的問題是,Agent構(gòu)建好后,如何創(chuàng)造大規(guī)模業(yè)務(wù)價值。為此,火山引擎推出推理代工服務(wù),支持極致彈性伸縮、全棧推理優(yōu)化以及分布式緩存。就像一臺已調(diào)校完成的頂級賽車,用戶只需將模型“插入發(fā)動機”,即可開啟運行。
今年7月,亞馬遜云科技發(fā)布了Amazon Bedrock AgentCore,將AI競爭推向全新高度。Agent也成為兵家必爭之地。
身份與權(quán)限管理、Agent黑盒、存量系統(tǒng)智能化、原型到生產(chǎn)都是企業(yè)構(gòu)建Agent會出現(xiàn)的問題。圍繞Agent開發(fā)、部署、運維、調(diào)優(yōu)、管控,火山引擎今天也發(fā)布了自己的技術(shù)體系,AI Agent平臺 AgentKit+HiAgent。
AgentKit構(gòu)建了一套讓Agent真正走向生產(chǎn)規(guī)模化落地的基礎(chǔ)設(shè)施底座,具備了身份認證、運行時、云沙箱、網(wǎng)關(guān)、記憶庫、可觀測、評測、安全圍欄。
回顧傳統(tǒng)Agent開發(fā),開發(fā)者需要手動調(diào)用模型、解析結(jié)果,并處理各種狀態(tài)與異常。前端邏輯通常需要七八百行代碼,后端接口及云資源調(diào)用也需相同量級,總計至少1500至2000行,而且出錯風(fēng)險較高。
AgentKit能夠?qū)⑦@些復(fù)雜控制邏輯通過SDK或服務(wù)開箱即用。只需少量集成,前端Agent 僅需約50行代碼,后端十幾行就可完成簡單串聯(lián),整套實現(xiàn)控制在61行以內(nèi),相比傳統(tǒng)方式代碼量減少約96%。更重要的是,依托預(yù)置云端服務(wù),Agent 的開發(fā)與運行穩(wěn)定性大幅提升,使團隊能夠更快構(gòu)建、迭代,將Agent推向生產(chǎn)環(huán)境。
2024年火山引擎就發(fā)布了為企業(yè)提供更全面的AI應(yīng)用開發(fā)與運營解決方案HiAgent。期間也在不斷迭代,今年HiAgent推出了“1+N+X”體系,即一個統(tǒng)一AI任務(wù)調(diào)度入口、N個企業(yè)通用智能體、X個業(yè)務(wù)定制智能體應(yīng)用,幫助企業(yè)加速Agent規(guī)模化落地。
火山引擎正在讓AI從技術(shù)潛力,真正轉(zhuǎn)化為行業(yè)生產(chǎn)力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.