網易首頁 > 網易號 > 正文申請入駐

豆包 2.0 模型發布，全信息整理（全網最完整，另附 79 頁 Model Card）

2026-02-14 15:11:50　來源: 賽博禪心

北京舉報

分享至

今天 Seed2.0 全系列正式發布
Seed2.0，也就是豆包大模型2.0（Doubao-Seed-2.0）

包括 Pro、Lite、Mini 三款通用 Agent 模型加一個 Code 模型，圍繞 Agent 使用和大規模生產，做了系統性優化

先看數據（本文里所有表格，都是我做的，好不好看?。。。?/p>

Seed2.0 核心評測數據總覽｜vs GPT-5.2 · Claude Opus-4.5 · Gemini-3 Pro

先一次過完核心部份：

多模態，數學與視覺推理 19 項基準 12 項第一，視覺感知、文檔理解、長上下文大部分基準 SOTA，EgoTempo 超過人類分數

LLM 科學能力，HealthBench 第一，SuperGPQA 超 GPT-5.2，整體與 Gemini 3 Pro、GPT-5.2 相當；在深度研究上也取得了不俗的成績

代碼，有明顯進步，部分高難基準與國際領先模型仍有差距

已上線，豆包 App 選「專家」模式 / TRAE 選「Doubao-Seed-2.0-Code」，全系列 API 已上線火山引擎，價格較同級 GPT 和 Claude 便宜一個數量級

Model Card 也有，同時發布的還有一份 79 頁的 Model Card，公眾號后臺回復「Seed2.0」，獲取這份 Model Card

先說定價

Seed2.0 全系列的這四款模型，API 已上線火山引擎。以下為分段計費中 ≤32k 輸入的價格，單位元/百萬 tokens，這里我也做了個對比圖：

價格對比（人民幣計價）

Pro（doubao-seed-2-0-pro-260215）旗艦全能，面向復雜推理與長鏈路 Agent 任務
輸入 3.2 / 輸出 16 / 緩存命中 0.64

Lite（doubao-seed-2-0-lite-260215）均衡型，綜合能力超 Seed1.8，兼顧質量與速度
輸入 0.6 / 輸出 3.6 / 緩存命中 0.12

Mini（doubao-seed-2-0-mini-260215）低時延高并發，256k 上下文，4 檔思考長度
輸入 0.2 / 輸出 2 / 緩存命中 0.04

Code（doubao-seed-2-0-code-preview-260215）編程加強版，適配 Claude Code 等 IDE 工具鏈
輸入 3.2 / 輸出 16 / 緩存命中 0.64

四款模型均支持文字、圖片、視頻輸入，文字輸出

token 定價，比海外模型低了約一個數量級。Agent 跑一次 workflow 消耗的 token 是人類對話的幾十倍

在現實世界的復雜任務中，大規模推理與長鏈路生成將消耗大量 token，這個成本變量會越來越重

火山引擎模型詳情頁：https://console.volcengine.com/ark/region:ark+cn-beijing/model/detail?Id=doubao-seed-2-0-pro

本次的優化

Seed 團隊分析了通用模型在 MaaS 服務中的真實調用情況

MaaS 調用場景分布

Seed 通用模型 MaaS 服務在中國大陸的調用場景分布，數據來自「火山方舟協作獎勵計劃」

最高比例的需求是處理混雜圖表、文檔等非結構化信息的知識內容。企業端的典型模式：先讓模型做「讀得多、想得多」的任務，再進入復雜且專業的流程型工作

基于這個真實需求，Seed2.0 重點優化三個方向：

?更穩健的視覺與多模態理解：復雜文檔、表格、圖形、視頻內容的解析能力顯著提升
?更可靠的復雜指令執行：多約束、多步驟、長鏈路任務的理解與執行能力強化
?更靈活的推理選擇：Pro、Lite、Mini 三檔加 Code 模型，覆蓋不同場景

除了生產級需求，Seed2.0 還在推高模型智能上限。目前已經能從解決奧林匹克競賽類問題邁向支持研究級推理，比如嘗試探索埃爾德什級別的數學問題，也可以完成部分科學相關任務的編程工作

能解埃爾德什問題和能幫你整理一堆掃描版合同，是兩種能力
Seed2.0 兩個都在做

多模態理解：大部分基準 SOTA 數學與視覺推理

Seed2.0 Pro 在 MathVista、MathVision、MathKangaroo、MathCanvas 等數學推理基準上達到業界最優水平。LogicVista、VisuLogic 等視覺解謎與邏輯推理基準上，較 Seed1.8 顯著提升

數學與視覺推理評測數據

標注 * 的數據引自公開技術報告

視覺感知

VLMsAreBiased、VLMsAreBlind、BabyVision 等基準中取得業界最高分。面對不同類型的視覺輸入時仍能保持準確且可信的感知和判斷能力

視覺感知與通用 VQA 評測數據

標注 * 的數據引自公開技術報告

文檔理解與長上下文

模型面對的，往往是復雜版式混排的原始材料。相比 Seed1.8，處理非結構化信息的能力顯著強化，ChartQAPro 與 OmniDocBench 1.5 達到頂尖水準

長上下文方面，DUDE、MMLongBench、MMLongBench-Doc 均取得業界最佳分數

文檔理解與長上下文評測數據

標注 * 的數據引自公開技術報告

視頻理解

時間序列與運動感知方面，TVBench、TempCompass、MotionBench 等關鍵測評處于領先位置

EgoTempo 超過人類分數（人類 63.2，Seed2.0 Pro 71.8），對「變化、動作、節奏」的捕捉更為穩定

長視頻場景中，Seed2.0 在大部分評測上超越了其他頂尖模型，可以高效準確地處理小時級別的長視頻。視頻工具 VideoCut 進一步提高了長視頻處理的時長范圍和推理精度

流式實時視頻方面同樣表現優異，能完成實時視頻流分析、環境感知、主動糾錯與情感陪伴，可應用于健身、穿搭等場景

視頻理解評測數據

標注 * 的數據引自公開技術報告

LLM 與 Agent：真實長程任務執行能力提升

Seed 團隊觀察到一個典型失衡：模型已經可以順利解決競賽難題，但放在真實世界中，依然很難端到端地完成實際任務，比如一次性構建一個設計精良、功能完整的小程序

原因來自兩點。真實世界任務跨越更長時間尺度、包含多個階段，現有 LLM Agent 難以自主構建高效工作流。真實世界知識具有很強的領域壁壘且呈長尾分布，各行業的經驗不在訓練語料的高頻區

長尾領域知識

Seed2.0 通過系統性加強長尾領域知識來應對

SuperGPQA 超過 GPT-5.2，HealthBench 第一名，科學領域整體成績與 Gemini 3 Pro 和 GPT-5.2 相當。FrontierSci 等 STEM 基準表現突出，部分場景得分超過 Gemini 3 Pro

LLM 科學能力評測數據指令遵循

Seed2.0 保持較強的一致性與可控性，為 Agent 模型在長鏈路、多步驟任務中嚴格按約束條件執行奠定了基礎

指令遵循評測數據深度研究

Seed2.0 在長鏈路任務中表現突出，尤其擅長連續完成「找資料、做歸納、寫結論」這類連續工作流

三項深度研究評測，Pro 和 Lite 都取得了不俗的成績

深度研究評測數據真實世界任務

在具備直接經濟價值的現實任務評測中，Seed2.0 在客服問答、信息抽取、意圖識別、中小學階段問題解答等高頻場景上表現穩定。GDPVal-Diamond、XPert Bench 等復雜專業任務基準上同樣取得有競爭力的結果

真實世界任務評測數據科學發現

FrontierSci-research 等前沿科研基準上表現強勁，AInstein Bench 領先，體現出在科學發現場景中較強的假設驅動式推理能力

科學發現評測數據從研究想法到實驗方案

Seed2.0 還能把「研究想法」推進到「形成可落地的實驗方案」

以高爾基體蛋白分析為例，模型把基因工程、小鼠模型構建、亞細胞分離與多組學分析串成一條完整流程，細化到關鍵環節怎么做、用什么做對照排除污染、用哪些指標評估純度

相關領域專家的反饋：方案在跨學科的實驗細節與步驟化表達上超出預期，能產出結構清晰、科學上相對可靠、具有可執行性的實驗草案

高爾基體蛋白分析實驗方案示例代碼：有進步，有差距

端到端整體代碼生成、上下文學習方面取得了明顯進步

Vibe Coding 及上下文評測數據

部分高難基準上，與國際領先模型相比仍有提升空間

最后

除了火山 API 之外，Seed2.0 Pro 和 Code 還已分別上線：

? 豆包 App：選擇「專家」模式，開啟對話
? TRAE：在「內置模型」中選擇「Doubao-Seed-2.0-Code」

以及，火山的這個模型，也已上線方舟 Coding Plan，且首月低至 8.91 元

新春限時特惠 ?? 二月特別補貼

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

MiniMax又來吃龍蝦肉了！OpenClaw真一鍵部署，還有上萬智能體

量子位 2026-02-25 23:52:50
16 跟貼 16
阿里高德發布SpatialGenEval，揭秘誰才是真正的文生圖大師

機器之心Pro 2026-02-24 19:24:57
0 跟貼 0

微信出新功能，網友：簡直是社恐福音

南方都市報 2026-02-25 16:59:07
1278 跟貼 1278

如果你也養“龍蝦”，阿里云這次把token價格打穿了

每日經濟新聞 2026-02-25 22:07:09
44 跟貼 44
春節AI暗戰

鈦媒體APP 2026-02-24 15:56:17
0 跟貼 0

熱度第一、Tokens周調用破3T，MiniMax這個春節殺瘋了

機器之心Pro 2026-02-23 18:46:36
1 跟貼 1

AI能否「圣地巡禮」？多模態大模型全新評估基準VIR-Bench來了

機器之心Pro 2025-10-15 16:05:02
0 跟貼 0
DeepSeek新模型曝光：傳華為搶先適配

智東西 2026-02-26 13:18:24
0 跟貼 0

大掛車拉沙子，工地防止大量超載，每輛車走前必須經過這道程序！

孟夏搞笑 2026-02-23 15:31:18
27 跟貼 27
AI記住失敗經驗：微軟提出Re-TRAC框架，4B性能SOTA，30B超越358B

機器之心Pro 2026-02-25 17:33:51
0 跟貼 0
全網圍觀：Meta超級智能安全總監，被OpenClaw刪光了郵件

機器之心Pro 2026-02-24 14:20:40
1 跟貼 1
銀河通用機器人“表演”變“上崗”，端到端大模型銀河星腦有多強

量子位 2026-02-18 10:56:58
5 跟貼 5
大模型碰到真難題了，測了500道，o3 Pro僅通過15%

機器之心Pro 2025-09-15 10:45:10
1 跟貼 1
擴散模型成最快深度思考！告別自回歸每秒1009個tokens

量子位 2026-02-26 10:01:39
0 跟貼 0
續航不升反降！4680版Model Y上架，特斯拉這操作太騷了！

極果酷玩 2026-02-25 12:14:09
12 跟貼 12
1000 塊/年的輸入法，我用它習慣了「口噴」，再也回不去打字了 | AI 器物志

愛范兒 2026-02-21 18:39:19
6 跟貼 6
從平面幾何出發：形式化驗證如何驅動MLLM的推理能力躍遷

機器之心Pro 2026-01-20 19:17:51
0 跟貼 0
開始搶人！美國一周挖走4名中國頂尖人才，年薪1個億美元令人咋舌

壹知眠羊 2026-02-25 14:33:55
4 跟貼 4
具身大腦項目，扎堆晉升獨角獸！

財聯社 2026-02-25 19:32:04
0 跟貼 0
日本計劃部署導彈部隊距臺灣僅110公里中方強硬表態

環球網資訊 2026-02-26 06:54:33
4068 跟貼 4068
Minimax持續猛挖“龍蝦肉”

華爾街見聞官方 2026-02-26 12:33:33
1 跟貼 1
別用“美國要完了”的幻覺，騙自己過日子

廖保平 2026-02-24 09:22:37
204 跟貼 204
近年來最生猛華語電影，尺度過大無緣內地市場

胖魚看劇 2026-02-25 09:59:23
1 跟貼 1
測了20個AI設計工具，這個Design Agent直接封神

家居避雷針吖 2026-02-24 13:51:23
0 跟貼 0
消費級顯卡可跑！剛剛，阿里Qwen3.5又開源3款新模型

機器之心Pro 2026-02-25 17:09:48
16 跟貼 16
回家第一件事是教爸媽用豆包

50歲阿姨自駕游 2026-02-23 21:40:00
0 跟貼 0
搞對象啥程序？北京天壇馬哥帶您回憶，5060后經歷過嗎

北京妙姐 2026-02-24 21:36:10
0 跟貼 0
看清事物本來的樣子，我們就能夠贏得未來

愛讀書的陜北大叔 2026-02-24 11:23:40
11 跟貼 11
2天半賣爆30萬冊！還是國家隊厲害！

秋葉大叔 2026-02-26 07:38:49
0 跟貼 0
60秒看懂，我私藏的卡點AI產品廣告工作流！

卡爾的AI沃茨 2026-02-25 19:11:33
0 跟貼 0
阿里云推出低價AI編程套餐，集成四大頂級開源模型

華爾街見聞官方 2026-02-26 06:30:00
15 跟貼 15
基準10年期日本國債期貨早盤下跌0.24點

每日經濟新聞 2026-02-26 08:06:06
0 跟貼 0
豆包圖像生成免費去水印的方法

蒙以專業錄課軟件 2026-02-24 21:08:57
1 跟貼 1
關于我用豆包點餐這件事！

小魚陪拉片 2026-02-24 01:25:22
0 跟貼 0
印度尼西亞股票基準指數下跌1%至8237.95點

每日經濟新聞 2026-02-26 11:38:20
0 跟貼 0
清華聯手千問重塑歸一化范式，讓 Transformer 回歸「深度」學習

機器之心Pro 2026-02-10 18:50:12
0 跟貼 0
300多只東北虎“輕斷食”？景區：每天斷食1個園，司機會帶游客找可投喂區

封面新聞 2026-02-23 16:29:03
1619 跟貼 1619
三維空間太難懂？2

機器之心Pro 2025-12-31 13:49:19
0 跟貼 0
斯坦福氛圍編程課火了！用AI搞定軟件開發全流程

量子位 2026-02-25 09:55:05
0 跟貼 0
數據缺少標注RL能誘導模型推理嗎？Co-rewarding提供自監督RL方案

機器之心Pro 2026-02-25 17:42:40
0 跟貼 0

賽博禪心

拜AI古佛，修賽博禪心

302文章數 44關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

親子

教育

本地

手機

藝術

手機 / 數碼

房產 / 家居

豆包 2.0 模型發布，全信息整理（全網最完整，另附 79 頁 Model Card）

單季營收681億凈利429億！英偉達再次炸裂

特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

特朗普自詡開啟美國"黃金時代" 遭美媒集體"打臉"

從排球少女到冰壺女神，她在米蘭冬奧練出6塊腹肌

尼格買提撒貝寧滑雪被偶遇 17年老友情

短劇市場風云突變！有人投百萬賠得精光

第五代宏光MINIEV煥新 四門玩趣代步車來襲

態度原創

從“不能出教室”到“必須動起來”：學校真的做得到嗎？

津南好·四時總相宜

三星Galaxy S26 Ultra手機支持2400萬像素直出

2025年百家金陵畫展 | 油畫作品選刊

豆包 2.0 模型發布，全信息整理（全網最完整，另附 79 頁 Model Card）

單季營收681億凈利429億！英偉達再次炸裂

第五代宏光MINIEV煥新四門玩趣代步車來襲