<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<blockquote id="9vnys"></blockquote>

<blockquote id="9vnys"><rt id="9vnys"></rt></blockquote>

<pre id="9vnys"><source id="9vnys"><input id="9vnys"></input></source></pre>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

豆包2.0的目標，不是成為做題家

2026-02-15 10:06:51　來源: 字母榜

北京舉報

0

分享至

對于大模型，OpenAI、Anthropic、谷歌等全球頂尖的AI公司，都在不斷地強調模型的通用性，以及其涌現能力。可字節在豆包2.0上，卻來了一波“反向操作”。

字節跳動選擇了一條更務實的路徑。他們從真實業務場景倒推模型能力。

豆包團隊發現，企業用戶最高頻的需求不是解奧數題，而是處理混雜著圖表、文檔的非結構化信息，然后在這個基礎上完成多步驟的專業任務。

于是豆包2.0把優化重點放在了多模態理解、長上下文處理、指令遵循這些“不那么性感但很實用”的能力上。

這種路徑選擇可能更接近AGI的本質。

真正的通用智能不是在所有基準測試上都拿高分，而是能在真實世界各種雜七雜八的約束下，依然按要求完成任務。

一個能解IMO金牌題但無法完成企業報表分析的模型，和一個可以穩定完成業務流程的模型，哪個更“智能”？

豆包2.0的答案很明確。

我把這段話發給了豆包2.0，它回答我說

雖然有些阿諛奉承、迎風拍馬，但我們的觀點是相似的。

01

豆包2.0來了

就在2026年情人節這天，豆包更新了2.0版本。PC、網頁版、手機用戶都可以從對話框選擇“專家”模式，以開啟豆包2.0。

與此前版本相比，豆包2.0的核心變化在于從“能解題”轉向“能做事”——針對大規模生產環境的使用需求進行了系統性優化。

豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和一款 Code 模型。

豆包2.0Code 接入了AI編程產品TRAE，而火山引擎也同步上線了豆包2.0系列模型API服務。

從公開的基準測試數據來看，豆包2.0 Pro在多個維度上取得了有競爭力的成績。

豆包2.0在IMO、CMO 數學競賽和ICPC編程競賽中獲得金牌成績，在 Putnam基準測試上超越了Gemini 3 Pro。

在HLE-Text（人類的最后考試）這項綜合性評測中，豆包2.0 Pro得分54.2，在參與對比的模型中排名第一。

不過需要注意的是，基準測試成績與實際應用表現之間存在差異。

字節跳動團隊自己也承認，豆包2.0在端到端整體代碼生成、上下文學習等方面，與國際領先模型相比仍有提升空間。

這種坦誠的表態，比單純強調優勢更有說服力。

在科學領域知識測試中，豆包2.0的表現與Gemini 3 Pro和GPT-5.2處于同一水平線。

在SuperGPQA測試中，豆包2.0 Pro得分68.7，略高于GPT-5.2的67.9。在HealthBench測試中得分57.7，排名第一。

這些數據表明，相較于豆包1.8，新版本的豆包在長尾領域知識覆蓋上有所加強。

豆包2.0在多模態理解上的提升是全方位的。

在視覺推理方面，模型在MathVista、MathVision等基準上達到了業界最優水平。

這些考試比簡單的圖像識別要復雜得多。

因為這些測試的目的，是考察模型能否從圖像中提取數學關系、理解幾何結構、進行邏輯推演。

在文檔理解場景中，豆包2.0在ChartQA Pro與OmniDocBench 1.5基準上的表現達到頂尖水平。

現實中的文檔往往是表格、圖表、文字、公式混雜的復雜版式，模型需要準確識別結構、提取信息、理解關系。

在長上下文理解方面，豆包2.0在 DUDE、MMLongBench等測試中取得了較好成績。

視頻理解是豆包2.0的一個重點優化方向。

在TVBench、TempCompass、MotionBench等測試中，豆包2.0處于領先位置。

值得注意的是，在EgoTempo基準上，豆包2.0的得分超過了人類水平。這個細節說明，模型在捕捉“變化、動作、節奏”這類時序信息時，可能比人類更穩定.

豆包2.0還支持流式實時視頻分析，可以實現環境感知、主動糾錯與交互。這種能力的應用場景包括健身指導、穿搭建議等，模型能實時觀察并給出反饋，而不是事后分析錄像。

02

豆包團隊如何實現？

其實豆包2.0的這些提升背后，涉及到了多個層面的優化。

多模態融合架構的改進是基礎。

傳統的多模態模型是把視覺編碼器和語言模型簡單拼接，視覺信息和文本信息的交互深度不夠。

豆包2.0強化了視覺與語言的深度融合，讓模型能更好地理解圖像中的語義信息。

人類看一張圖，它是包含因果關系的。

就拿這張圖來說，傳統多模態大模型看到這張圖，它理解的是“姚順宇”、“話筒”、“手”、“西裝”。

但是人類理解這張圖是“姚順宇西裝革履拿著話筒正在演講”。

即使圖片是靜態的，也能因為他的神態、穿著來判斷此時正在做什么。

此外，豆包2.0對注意力機制的改進，為它帶來了長上下文處理能力的提升。

處理長文本或長視頻時，模型需要在海量信息中保持注意力，不能顧此失彼。

就比如你在閱讀這篇文章的時候，A部分出現了大量的技術名詞、術語，你也只會挑其中的圖片以及數字來一目十行地看，不會逐字逐句認真看。

因此豆包2.0其實是以人類讀長文章時那樣，自動抓重點，而不是平均分配注意力。

技術上，這需要更高效的注意力計算方法和更合理的信息篩選機制。

最后，豆包2.0推理能力的提升不只是記住更多知識，而是真正提升了從已知推導未知的能力。

這涉及到訓練過程中對推理鏈的顯式建模，讓模型學會“一步步思考”而不是直接給答案。這種能力在解決復雜問題時尤為重要。

03

現實不是競賽

字節跳動團隊觀察到一個現象，語言模型已經可以順利解決競賽難題，但放在真實世界中，它們依然很難端到端地完成實際任務。

比如一次性構建一個設計精良、功能完整的小程序。

這個鴻溝的原因主要有兩點，第一是知識覆蓋的問題。

競賽題目通常聚焦在數學、編程等核心領域，而真實任務往往涉及長尾領域的專業知識，比如前文提到的醫療、法律、工程、商業等等。

第二是指令遵循的問題。

真實任務通常包含多個步驟、多重約束，模型需要嚴格按照要求一步步推進，不能跑偏，不能遺漏。

豆包2.0試圖通過系統性加強長尾領域知識和強化指令遵循能力來彌合這個鴻溝。

從測試數據來看，在深度研究任務、復雜agent能力評估等方面，豆包2.0達到了業界第一梯隊水平。

在客服問答、信息抽取、意圖識別等高頻應用場景上，模型表現也比較穩定。

播客中給出了一個有意思的案例——高爾基體蛋白分析。

豆包2.0不僅能給出總體實驗路線，還能把基因工程、小鼠模型構建、亞細胞分離與多組學分析串成完整流程，細化到關鍵環節怎么做、用什么進行對照、用哪些指標評估純度。

相關領域專家表示，這個方案在跨學科的實驗細節與步驟化表達上，超出了他們對大模型的預期。

不過，從“能給出方案”到“方案真正可行”，中間還有驗證的距離。這個案例更多說明模型在知識整合和表達能力上的進步，而不是說它已經能替代科研人員做實驗設計。

眾所周知，AI編程是2026年最火的賽道，豆包2.0 Code是針對編程場景優化的版本，已上線TRAE作為內置模型。

字節團隊展示的案例是“TRAE春節小鎮·馬年廟會”互動項目。通過1輪提示詞構建基本架構，再經過幾次調試，總共5輪提示詞完成作品。

這個小鎮里有11位由大語言模型驅動的NPC，會根據人設自然聊天、招呼顧客、現場砍價。

AI游客自己決定去哪家攤位、買什么、說什么。

其中，煙花升空時的祝福語、孔明燈上的題詞都由AI即時生成。每次進入小鎮，看到的互動都可能不同。

這個案例展示了豆包2.0 Code模型在快速原型開發上的能力。不過需要注意的是，從原型到產品之間還有很長的路要走。

從字節跳動的策略來看，豆包2.0強調“面向真實世界復雜任務”，這是一個務實的定位。

通過分析真實使用場景來指導模型優化，而不是單純為了刷榜。

這種以需求為導向的研發思路，可能比單純追求基準測試分數更有價值。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

重塑軟件工程：從Vibe Coding走向Spec Coding

鈦媒體APP 2026-02-11 09:37:53
57 跟貼 57
AI能否「圣地巡禮」？多模態大模型全新評估基準VIR-Bench來了

機器之心Pro 2025-10-15 16:05:02
0 跟貼 0

大模型產業化最好的時代，中國AI「殺死」了參數崇拜

36氪 2026-02-11 12:47:57
1 跟貼 1

高效智能體幕后推手是誰？一篇綜述帶你從記憶×工具學習×規劃看透

機器之心Pro 2026-01-27 15:24:36
0 跟貼 0
面壁智能開源全模態模型MiniCPM-o4.5，邊看邊聽還能主動搶答

量子位 2026-02-05 23:20:12
0 跟貼 0

1000 塊/年的輸入法，我用它習慣了「口噴」，再也回不去打字了 | AI 器物志

愛范兒 2026-02-21 18:39:19
3 跟貼 3

初創用3000萬造不可編程的AI芯片，推理速度是Nvidia最強GPU 50倍

DeepTech深科技 2026-02-21 18:28:56
6 跟貼 6
三維空間太難懂？2

機器之心Pro 2025-12-31 13:49:19
0 跟貼 0

從AlphaGo到DeepSeek R1，推理的未來將走向何方？

機器之心Pro 2026-02-20 13:28:45
0 跟貼 0
春晚“帶貨”新物種：具身機器人何以被瘋搶

36氪 2026-02-20 17:22:19
3 跟貼 3
機器人集體亮相春晚后：“假蔡明”被送給了真蔡明，“春晚版熊貓”拍出近6萬元高價

紅星新聞 2026-02-21 20:39:13
0 跟貼 0
以判別式監督學習強化推理LLM，解決難度偏差和熵崩塌難題

機器之心Pro 2025-10-28 11:14:55
0 跟貼 0
啟幕“十五五” | 2026 AI全鏈爆發：讀懂抓住機遇

通信世界 2026-02-21 22:02:05
0 跟貼 0
AI上春晚：一場十四億人的驗收

36氪 2026-02-18 10:56:31
5 跟貼 5
陳丹琦入職Mira翁荔公司，原來是有IOI三金王賽友

量子位 2026-02-06 14:29:49
0 跟貼 0
“胡牌”像放技能一樣簡單？王者麻將之最無腦公式“三連+一對”

榮耀張大仙 2026-02-17 12:33:11
5 跟貼 5
CMU開源首份Agentic Search日志數據，把Agent拆開給你看

機器之心Pro 2026-02-09 12:05:13
0 跟貼 0
華為推出軟工代碼智能體SWE-Lego，解鎖SFT訓練極致性能

機器之心Pro 2026-01-13 14:54:45
0 跟貼 0
理解與尊重比協議更重要：扎哈羅娃眼中的中俄關系底層邏輯

創作者_7SAu 2026-02-21 03:03:54
0 跟貼 0
中國游客稱因道路積雪被困俄羅斯“極光村” 超40小時，俄媒：滯留游客都已離開

上游新聞 2026-02-17 20:22:05
24829 跟貼 24829
人為什么一定要讀書，因為你讀的書越多，看問題角度就越多

木言觀 2026-02-19 20:46:19
84 跟貼 84
春晚《賀花神》的背后：Seedance 2.0學會了東方美學

小思說 2026-02-18 12:22:06
0 跟貼 0
為什么中國摩托，在非洲被印度三哥干掉了，背后邏輯很簡單！

笑到抽筋故事會 2026-02-20 16:28:00
0 跟貼 0
專業度直接降維打擊，王孟源邏輯秒殺蔡正元！

huaser不花 2026-02-21 14:18:38
0 跟貼 0
賈樟柯用AI拍短片，袁和平用豆包做彩蛋：AI會取代創作者嗎？

商道童言 2026-02-20 20:37:48
4 跟貼 4
我的過年方式：宅家，發呆，不聯系，不走訪任何一個親戚

一只小梨 2026-02-19 12:36:52
0 跟貼 0
家居裝修類公眾號文章需要優質配圖，試試豆包精致又適配兩步搞定

太公筆調 2026-02-20 19:15:18
0 跟貼 0
對聯用 AI 寫，測完我真是醉了

科技狐 2026-02-20 22:41:24
0 跟貼 0
蘇聯高爾基紀念碑矗立多年，在烏克蘭竟遭無情拆除，背后原因引人

趣味加工廠 2026-02-20 18:09:46
1 跟貼 1
豆包你現在強的有點可怕

石頭的碎碎念 2026-02-18 09:03:42
0 跟貼 0
一通電話高情商求助：從小撒這通電話看向上溝通的底層邏輯

達達愛剪輯 2026-02-20 00:58:43
0 跟貼 0
信奧賽家長群里大家聊培訓機構

誠誠教育行 2026-02-21 20:21:23
0 跟貼 0
OpenClaw 之父加入 OpenAI 前最后的訪談：你很難跟一個純粹為了好玩的人競爭

愛范兒 2026-02-20 17:25:49
3 跟貼 3
學霸的秘密：看懂數學公式，掌握解題技巧！

誠躍紡織品2 2026-02-20 06:16:13
0 跟貼 0
美軍開打前夕，俄交武器中方出手，殲20模型抵伊朗

戰武科普 2026-02-19 11:39:39
0 跟貼 0
谷歌突發Gemini 3.1 Pro！推理性能×2

量子位 2026-02-20 09:24:13
25 跟貼 25
中國常駐聯合國代表傅聰重申：日本沒資格要求入常

央視新聞客戶端 2026-02-21 08:01:36
3550 跟貼 3550
掌握這個公式，數學滿分不是夢！

阿飛愛分享 2026-02-19 01:15:39
0 跟貼 0
工齡37年9個月，江蘇60歲大爺養老金還可以！

樂天果果 2026-02-20 13:15:39
41 跟貼 41
Claude再次引爆美軟件股恐慌！新代碼工具讓傳統安全手段失靈？

DeepTech深科技 2026-02-21 22:04:18
0 跟貼 0

隨著1場決賽2次失誤，中國隊獎牌已無緣反超日本隊：僅剩1奪金點

隨著1場決賽2次失誤，中國隊獎牌已無緣反超日本隊：僅剩1奪金點

風過鄉

2026-02-21 21:27:13

金銀價再度大漲國內金飾價格逼近1600元/克專家提醒：勿追高，可分批布局

金銀價再度大漲國內金飾價格逼近1600元/克專家提醒：勿追高，可分批布局

紅星新聞

2026-02-21 12:50:23

這7種家電建議買老款，不是新款不好用，而是老款更實用

這7種家電建議買老款，不是新款不好用，而是老款更實用

室內設計師有料兒

2026-02-21 10:54:28

三峽大壩收支出爐：運行20余年，總投資近2500億，如今回本了嗎？

三峽大壩收支出爐：運行20余年，總投資近2500億，如今回本了嗎？

青梅侃史啊

2026-02-21 09:46:58

營養醫學專家夏萌：我為什么倡導低碳水飲食

營養醫學專家夏萌：我為什么倡導低碳水飲食

上觀新聞

2026-02-20 08:29:10

廣東隊迎來1好消息！2米05鋒線悍將恢復訓練，有望趕上CBA季后賽

廣東隊迎來1好消息！2米05鋒線悍將恢復訓練，有望趕上CBA季后賽

體育哲人

2026-02-21 21:38:11

俄媒稱貝加爾湖遇難者身份確認包括一4人家庭其中有個14歲的孩子

俄媒稱貝加爾湖遇難者身份確認包括一4人家庭其中有個14歲的孩子

勁爆體壇

2026-02-21 12:30:03

去了趟拉斯維加斯，這輩子再不想去二回，到處是陷阱防不勝防！

去了趟拉斯維加斯，這輩子再不想去二回，到處是陷阱防不勝防！

天下霸奇

2026-01-29 09:07:49

72萬個充電樁，年入40億，常州夫婦邊賺錢邊收割，如今要上市了

72萬個充電樁，年入40億，常州夫婦邊賺錢邊收割，如今要上市了

三農老歷

2026-02-20 02:39:16

終于知道家長要怎么面對孩子學業無成了，網友說得真實，不得不服

終于知道家長要怎么面對孩子學業無成了，網友說得真實，不得不服

夜深愛雜談

2026-02-21 22:55:00

陳小春曬春晚盒飯細節，引發群演待遇大討論！

陳小春曬春晚盒飯細節，引發群演待遇大討論！

TVB的四小花

2026-02-20 15:06:31

中國深夜得到消息，特朗普怒火三丈！美媒納悶：中國為何如此淡定

中國深夜得到消息，特朗普怒火三丈！美媒納悶：中國為何如此淡定

近史閣

2026-02-21 22:43:11

變化巨大，從了如指掌到一無所知，中國核潛艇被日本海軍追蹤25年

變化巨大，從了如指掌到一無所知，中國核潛艇被日本海軍追蹤25年

滄海旅行家

2025-12-14 23:12:42

谷愛凌明天凌晨沖擊金牌！CCTV5直播，中國代表團已獲4塊冬奧金牌

谷愛凌明天凌晨沖擊金牌！CCTV5直播，中國代表團已獲4塊冬奧金牌

足球評論qs

2026-02-21 08:46:08

女子婚禮穿低胸婚紗引熱議，全程用紙巾遮擋，網友：太尷尬了！

女子婚禮穿低胸婚紗引熱議，全程用紙巾遮擋，網友：太尷尬了！

流云隨風去遠方

2026-02-12 17:40:44

中東國家都已意識到了！就算中國高端武器再多，也無法保護他們

中東國家都已意識到了！就算中國高端武器再多，也無法保護他們

軒逸阿II

2026-01-14 04:20:15

手氣爆棚！河南52歲男子打麻將連續自摸胡牌，興奮過度，突然栽倒牌桌，送醫時血壓飆升至201/115mmHg

手氣爆棚！河南52歲男子打麻將連續自摸胡牌，興奮過度，突然栽倒牌桌，送醫時血壓飆升至201/115mmHg

芒果都市

2026-02-20 16:07:55

董璇人脈真牛，泡泡瑪特總裁王寧去她家過年，送小酒窩非常多禮物

董璇人脈真牛，泡泡瑪特總裁王寧去她家過年，送小酒窩非常多禮物

可愛小菜

2026-02-20 21:17:12

谷愛凌惹上麻煩了

行者殷濤

2026-02-20 20:16:47

清純天后“萬人唾”，為愛吸毒拍片無下限，徹底淪為“國際乞巧

清純天后“萬人唾”，為愛吸毒拍片無下限，徹底淪為“國際乞巧

談史論天地

2026-02-20 06:53:23

讓未來不止于大。

2242文章數 8042關注度

往期回顧全部

科技要聞

智譜上市1月漲5倍，市值超越京東、快手

頭條要聞

美軍戰機選在大年初二挑釁解放軍韓國防長抗議了

頭條要聞

美軍戰機選在大年初二挑釁解放軍韓國防長抗議了

體育要聞

徐夢桃：這是我第一塊銅牌給我換個吉祥物

娛樂要聞

黃曉明澳門賭博輸十幾億本人親自回應

財經要聞

一覺醒來，世界大變，特朗普改新打法了

汽車要聞

比亞迪的“顏值擔當”來了方程豹首款轎車路跑信息曝光

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

親子

游戲

家居

軍事航空

轉頭就暈的耳石癥，能開車上班嗎？

親子要聞

中韓寶寶得要從小灌輸中國文化真正的年味是什么？

卡婊總算玩明白了，《安魂曲》雙主角盤活生化30周年

家居要聞

本真棲居愛暖伴流年

中古雅韻樂韻伴日常
簡雅閑居靜享時光柔
寧靜港灣靈動與詩意

軍事要聞

硬核揭秘！福建艦“一馬當先”底氣何在

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<cite id="ydlwt"></cite>

^{<blockquote id="ydlwt"></blockquote>}