<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      字節豆包2.0重磅發布!成本暴降一個數量級,Seed團隊揭秘視頻Agent競爭關鍵

      0
      分享至


      整理 | 褚杏娟

      今天,字節正式發布豆包大模型 2.0 系列。據悉,豆包 2.0(Doubao-Seed-2.0)圍繞大規模生產環境下的使用需求做了系統性優化,重點加強高效推理、多模態理解與復雜指令執行能力,以更好地完成真實世界復雜任務。

      報告指出,當前大模型行業正在邁入“Agent 化階段”,開始承擔科研探索、復雜軟件開發、自主學習文檔、多階段現實工作流執行等任務。這一趨勢直接催生了 Seed2.0 系列,其設計目標是在大規模生產環境中,為用戶提供最優質、最穩定的使用體驗。

      為適配不同生產場景,Seed2.0 提供 Pro、Lite、Mini 三款通用 Agent 模型和一款 Code 模型,在性能、延遲與成本之間形成分層體系,支持大規模商業部署:

      • 2.0 Pro 面向深度推理與長鏈路任務執行場景,全面對標 GPT 5.2 與 Gemini 3 Pro;

      • 2.0 Lite 兼顧性能與成本,綜合能力超越上一代主力模型豆包 1.8;

      • 2.0 Mini 面向低時延、高并發與成本敏感場景;

      • Code 版(Doubao-Seed-2.0-Code)專為編程場景打造,稱與 TRAE 結合使用效果更佳。

      目前,豆包 2.0 Pro 已在豆包 App、電腦端和網頁版上線,用戶選擇“專家”模式即可對話體驗;豆包 2.0 Code 接入了 TRAE;面向企業和開發者,火山引擎也已上線豆包 2.0 系列模型 API 服務。

      Seed2.0 token
      單價約低一個數量級

      字節在 Model Card 中披露了 MaaS 使用情況,企業當前采用 AI 的典型路徑是:優先將模型用于處理大規模異構數據、整合跨領域知識并生成決策支持內容,而高度專業化場景則逐步推進落地。

      而 Seed 模型目前主要應用于互聯網、金融、新零售和企業服務領域,核心場景集中在非結構化信息處理、教育內容生成、搜索推薦系統和企業知識分析等方向。這種高強度生產環境反饋,使 Seed2.0 的訓練路徑與優化方向始終貼近真實業務需求。

      官方表示,Seed2.0 的一項核心優勢體現在其成本結構上。字節對比了當前主流基礎模型的 API 定價情況,從上圖可以看到,在保持接近前沿模型性能水平的前提下,Seed2.0 的 Token 單價約低一個數量級。


      “這一成本優勢對于企業級 MaaS 部署尤為關鍵。”官方表示,Seed2.0 的定價體系,使得許多在其他平臺上難以承受的應用場景具備了經濟可行性,同時并未犧牲生產級推理和生成質量。

      Seed2.0 系列通過分級定價體系適配不同負載需求:Pro 版本主要面向高復雜度推理和長上下文任務,強調能力上限;Lite 版本提供性能與成本的均衡方案;Mini 版本則將輸出成本控制在極低水平,為高并發、低延遲場景打開空間。

      核心提升方向:
      大規模部署下的用戶體驗

      此次,Seed2.0 將“在線大規模部署下的用戶體驗”作為核心優先級,重點圍繞四個現實問題進行優化:視覺與多模態請求占比持續提升、推理延遲直接影響用戶留存、復雜指令執行可靠性不足以及編程輔助穩定性不足。

      針對大量涉及截圖、表格、掃描文檔和混合媒體的真實用戶請求,Seed2.0 顯著增強了視覺推理能力與結構化信息抽取能力,并通過系統訓練降低幻覺風險。在推理效率方面,團隊通過模型壓縮與推理優化技術,使不同版本能夠適配從高復雜度分析到高并發調用等多種場景。

      多模態理解能力全面升級,多數基準達 SOTA

      為全面驗證模型能力,Seed 團隊構建了覆蓋基礎語言、基礎視覺、基礎 Agent 能力及高價值任務的系統化評測體系,對比對象包括 GPT-5.2 High、Claude-Sonnet-4.5 等國際主流模型,確保評測結果的客觀性與參考價值。評測顯示,Seed2.0 Pro 在多個基準測試中表現優異,數學推理達到 IMO、CMO 金牌水準,Codeforces Elo 評分達 3020,長上下文理解能力在 Frames 榜單中排名第一。


      在部分測試中引入 VideoCut 后,Seed2.0 Pro 在多個基準上實現顯著提升,尤其在 ZeroVideo 任務中準確率幾乎翻倍。團隊認為,這一結果表明,未來視頻 Agent 的核心競爭力不僅取決于模型本身,還高度依賴于工具體系與調度能力。

      在視覺理解領域,Seed2.0 在數學推理、STEM 理解、空間定位、文檔解析和長文檔處理等任務中取得系統性提升,在多個基準中達到當前最優水平。特別是在多頁文檔、復雜圖表和高密度信息場景下,Seed2.0 的穩定性與準確性顯著優于前代模型。


      視覺推理及感知

      面對動態場景,豆包 2.0 強化了對時間序列與運動感知的理解能力,在 TVBench 等關鍵測評中處于領先位置,且在 EgoTempo 基準上超過了人類分數,表明它對“變化、動作、節奏”這類信息的捕捉更為穩定,在工程側可用性更高。

      長程任務執行能力提升

      長視頻場景中,豆包 2.0 在大多評測上超越了其他頂尖模型,且在多個流式實時問答視頻基準測試中表現優異,能作為 AI 助手完成實時視頻流分析、環境感知、主動糾錯與情感陪伴,實現從被動問答到主動指導的交互升級,可應用于健身、穿搭等陪伴場景。


      真實世界任務測評

      針對當前主流 Agent 系統“能解競賽題、難完成真實業務任務”的痛點,Seed2.0 通過系統化吸收長尾專業知識,有效補強能力短板,縮小與真實業務需求的差距。

      豆包 2.0 Pro 在 SuperGPQA 上分數超過 GPT 5.2,并在 HealthBench 上拿到第一名,在科學領域的整體成績與 Gemini 3 Pro 和 GPT 5.2 相當。

      在推理和 Agent 能力評測中,豆包 2.0 Pro 在 IMO、CMO 數學奧賽和 ICPC 編程競賽中獲得金牌成績,也超越了 Gemini 3 Pro 在 Putnam Bench 上的表現,展現了強勁的數學和推理能力。在 HLE-text(人類的最后考試)上,豆包 2.0 Pro 取得最高分 54.2 分,在工具調用和指令遵循測試中也有出色表現。


      Code 模型重點強化前端語義理解等

      豆包 2.0 Code 是基于 2.0 基座模型,針對編程場景進行優化的版本。其強化了代碼庫解讀能力,還提升了應用生成能力。此外,豆包 2.0 Code 還增強了模型在 Agent 工作流中的糾錯能力。

      在開發者關注的 Agent 編程場景中,Seed2.0 展現出極強的場景適配性。開發者行為分析揭示了一趨勢:前端開發成為 Agent 編程主戰場。JavaScript、TypeScript、CSS 與 HTML 占據絕對主導,Vue.js 使用率約為 React 的三倍,Bug 修復與調試類任務位列第一。這一結構性分布直接影響模型訓練方向:必須強化前端語義理解、布局推理和報錯診斷能力,而非單純追求算法競賽分數。

      針對這一特點,Seed2.0 重點強化了前端語義理解、CSS 布局推理等能力,同時聚焦 Bug 修復、代碼重構等開發者核心痛點,提升調試能力與問題定位效率,大幅降低開發成本。

      該模型已上線 TRAE 中國版作為內置模型,支持圖片理解和推理。

      未來重點:長鏈路智能系統構建

      Seed2.0 的整體設計思路,已經從單點能力優化,升級為面向復雜系統的整體智能構建。

      從產品導向看,Seed2.0 的訓練與優化高度貼合真實業務反饋。在面向大眾用戶的產品中,重點強化指令魯棒性、長尾知識覆蓋與長上下文穩定性;在面向開發者和企業用戶的系統中,則優先強化代碼推理、流程執行與系統協同能力。

      從工程導向看,Seed2.0 通過多規格模型體系、分級定價機制和工具協同框架,實現了能力、成本與性能之間的動態平衡,使模型能夠靈活嵌入不同規模和復雜度的業務系統之中。

      當然,團隊也坦言當前 Seed2.0 仍然存在若干結構性限制:在超長周期任務中,自組織能力仍不足;在極端專業化領域,與真正專家級理解尚有差距;多模態統一表征尚未完全成熟;隨著模型自主性增強,安全與可控性問題變得更加復雜。未來方向將圍繞長鏈路推理、多工具協同調度、行業級高質量數據建設和安全對齊機制展開。

      長期智能發展角度來看,Seed 團隊明確將研究重心從“短鏈路問答優化”逐步轉向“長鏈路智能系統構建”,重點突破長期規劃、自主學習、跨任務遷移和經驗積累等關鍵能力瓶頸,為未來更高階通用智能奠定基礎。以下為 Seed 團隊明確的未來幾條核心發展路線:

      • 在能力層面,將持續強化長鏈路推理能力,使模型能夠在跨階段任務中形成穩定認知結構,并逐步實現經驗內化。

      • 在系統層面,將進一步深化 Agent 框架與工具體系的融合,構建更完善的多工具協同調度機制,使模型能夠靈活調用外部資源完成復雜任務。

      • 在數據層面,將加大對真實行業場景、專業知識體系和高質量長文檔數據的建設力度,進一步提升模型在垂直領域中的適用性。

      • 在安全層面,將持續完善對齊機制、風險控制框架和行為評估體系,確保模型能力增長與社會責任同步推進。

      https://seed.bytedance.com/zh/seed2

      聲明:本文為 InfoQ 整理,不代表平臺觀點,未經許可禁止轉載。

      InfoQ 新年禮物上線啦!

      AI 快訊輪播推送正式上線,給你更優的閱讀體驗、更強的 AI 賦能、更懂 AI 行業的資訊檢索~我們會持續優化體驗,追求更深度的 AI 能力內化改造,歡迎大家體驗并反饋!立即前往 InfoQ 官網,體驗 AI 快訊帶來的全新閱讀感受吧!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      李亞鵬年初六到陳光標家做客!為陳環保送行,陳光標妻子罕見露臉

      李亞鵬年初六到陳光標家做客!為陳環保送行,陳光標妻子罕見露臉

      離離言幾許
      2026-02-22 23:36:16
      突發,一客機著飛著發動機掉了!!?

      突發,一客機著飛著發動機掉了!!?

      中國民航人
      2026-02-23 11:57:55
      破防!谷愛凌接連傳來“噩耗”,比外婆去世更糟心的事兒發生了

      破防!谷愛凌接連傳來“噩耗”,比外婆去世更糟心的事兒發生了

      陳意小可愛
      2026-02-23 12:57:32
      工齡33年2個月,浙江大姐養老金真讓人羨慕!

      工齡33年2個月,浙江大姐養老金真讓人羨慕!

      樂天果果
      2026-02-23 16:54:30
      朝鮮戰爭結束,全世界都對志愿軍進行研究,英國人的評價簡直絕了

      朝鮮戰爭結束,全世界都對志愿軍進行研究,英國人的評價簡直絕了

      芊芊子吟
      2026-02-23 15:25:03
      山東一退伍老兵過百歲大壽,家族240余人相約從全國各地趕來賀壽,五世同堂齊拍全家福

      山東一退伍老兵過百歲大壽,家族240余人相約從全國各地趕來賀壽,五世同堂齊拍全家福

      環球網資訊
      2026-02-23 14:33:09
      馬年大吉!機構看好這36股,7股年內漲超50%

      馬年大吉!機構看好這36股,7股年內漲超50%

      21世紀經濟報道
      2026-02-23 15:35:27
      前烏軍總司令扎盧日內爆出猛料,俄烏開戰前夕,澤連斯基多次誤判

      前烏軍總司令扎盧日內爆出猛料,俄烏開戰前夕,澤連斯基多次誤判

      碳基生物關懷組織
      2026-02-21 22:57:12
      多國民眾上街聲援烏克蘭,美方欲促成澤連斯基與普京三周內會面

      多國民眾上街聲援烏克蘭,美方欲促成澤連斯基與普京三周內會面

      近距離
      2026-02-22 17:58:25
      浙江人為什么這么有錢?毫不夸張地說,這真是個令人敬佩的地方!

      浙江人為什么這么有錢?毫不夸張地說,這真是個令人敬佩的地方!

      離離言幾許
      2026-02-23 12:04:00
      雷佳音沒撒謊!退出春晚,解散公司,性格大變的賈玲,證實他的話

      雷佳音沒撒謊!退出春晚,解散公司,性格大變的賈玲,證實他的話

      說歷史的老牢
      2026-01-20 13:43:24
      他們兩個不會偷偷的在一起了吧,確實他們挺合適的男才女貌

      他們兩個不會偷偷的在一起了吧,確實他們挺合適的男才女貌

      科學發掘
      2026-02-23 09:20:18
      我國著名主持人赴瑞士安樂死,兒子講述其死前慘狀:我非常后悔

      我國著名主持人赴瑞士安樂死,兒子講述其死前慘狀:我非常后悔

      阿訊說天下
      2026-02-21 12:35:11
      張一山跟發小聚會!新家又大又豪,別人都大叔了,他還像個小孩子

      張一山跟發小聚會!新家又大又豪,別人都大叔了,他還像個小孩子

      社會日日鮮
      2026-02-22 04:44:24
      谷愛凌戴32萬手表領金牌,她戴的施華洛世奇千元耳飾已售罄!

      谷愛凌戴32萬手表領金牌,她戴的施華洛世奇千元耳飾已售罄!

      車窗起霧q
      2026-02-23 00:54:25
      WTT新加坡大滿貫:混雙8強決出4席!頭號種子上演驚天大逆轉

      WTT新加坡大滿貫:混雙8強決出4席!頭號種子上演驚天大逆轉

      全言作品
      2026-02-23 17:10:35
      這個國家一口氣花150億請中國駐軍,又花35億買導彈,付款極爽快

      這個國家一口氣花150億請中國駐軍,又花35億買導彈,付款極爽快

      近史談
      2026-02-22 21:46:43
      在七千多的養老院住了一年才明白:再貴的養老院,也買不來這3樣

      在七千多的養老院住了一年才明白:再貴的養老院,也買不來這3樣

      小馬達情感故事
      2026-02-10 11:50:09
      別被春晚騙了!王興興直言:現在機器人,只相當于10歲孩子水平

      別被春晚騙了!王興興直言:現在機器人,只相當于10歲孩子水平

      天天熱點見聞
      2026-02-23 05:14:38
      有人說:什么時候公務員不再是擠破頭的職業,那社會就百業興旺了

      有人說:什么時候公務員不再是擠破頭的職業,那社會就百業興旺了

      細說職場
      2026-01-16 11:57:05
      2026-02-23 19:40:49
      InfoQ incentive-icons
      InfoQ
      有內容的技術社區媒體
      12069文章數 51762關注度
      往期回顧 全部

      科技要聞

      智譜、MiniMax合計蒸發近千億市值,為何?

      頭條要聞

      鄭麗文接受外媒專訪:若臺海爆發沖突臺灣將成最大輸家

      頭條要聞

      鄭麗文接受外媒專訪:若臺海爆發沖突臺灣將成最大輸家

      體育要聞

      哈登版騎士首敗:雷霆的冠軍課

      娛樂要聞

      田亮一家新年全家福!森碟變清純少女

      財經要聞

      美國海關將停止征收被裁定違法的關稅

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      本地
      手機
      旅游
      游戲
      健康

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      手機要聞

      CINNO Research:淡季疊加成本高企 2月手機面板價格全線下行

      旅游要聞

      正月初六赴千年之約!廣濟橋人山人海,美到窒息

      騰訊暴改硬核游戲,把人騙進來“爽”

      轉頭就暈的耳石癥,能開車上班嗎?

      無障礙瀏覽 進入關懷版