<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      春節大模型混戰升級:豆包2.0沖擊最強多模態Agent,超級AI牛馬搞定企業級難題

      0
      分享至


      智東西
      作者 云鵬
      編輯 漠影

      春節將至,國內AI大模型賽道好不熱鬧,多款國產模型更新引爆海內外,不少海外網友都“跪求”體驗方式,2026開年AI檔,還要看中國玩家。

      在這場AI盛宴之中,我們看到各類超級Agent走到舞臺C位,AI逐漸深入到具體的工作流中,甚至開始幫企業啃下真正的“硬骨頭”任務。

      AI從“玩具”轉向“工具”,這一趨勢十分明顯、

      在國內AI模型爆更熱潮中,字節火山引擎成為其中代表性玩家,重磅新品發布不斷,主打一個“量大管飽”,近三天直接新模型“三彈連發”:

      12日豆包視頻生成模型Seedance 2.0正式登場、13日圖像創作模型Seedream 5.0 Lite發布,今天,最新多模態Agent模型豆包2.0(Doubao-Seed-2.0)正式登場,這也是豆包大模型自2024年5月正式發布以來首次大版本的跨代升級。


      總體來看,豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型,經實際體驗測試,其在企業級Agent能力、多模態理解、推理代碼能力及靈活工具調用能力方面都有著顯著增強,在真實長鏈路任務中表現亮眼。


      ▲豆包2.0在各類視覺理解任務上實現SOTA,視覺推理、感知能力、空間推理與長上下文理解能力表現突出,在大多數相關基準測試中取得最高分


      ▲在推理和Agent能力評測中,豆包2.0 Pro在IMO、CMO數學奧賽和ICPC編程競賽中獲得金牌成績,在Putnam Bench上超越Gemini 3 Pro,在HLE-text(人類的最后考試)中,豆包2.0 Pro取得最高分54.2分,在工具調用和指令遵循測試中成績領先

      在豆包2.0的加持下,我們可以輕松擁有一個可以實時互動的AI健身教練:

      或者基于給定圖像,精準生成匹配的matplotlib Python繪圖代碼,實現圖像到繪圖代碼轉化:


      豆包2.0還可以直接操作軟件執行專業復雜任務,比如進行CAD設計與操作,建模并完成幾何參數提取:


      在當前行業聚焦攻克AI處理企業復雜長任務的大趨勢下,豆包2.0無疑成為字節火山引擎在企業級市場的重要一步。

      目前,豆包2.0 Pro已在豆包App、電腦端和網頁版上線,我們只需要選擇專家模式就可以體驗,火山引擎也上線了豆包2.0系列模型的API服務。


      ▲豆包App界面

      一、實測上手驚艷:一句話制作專業可視化報告、輕松開發網頁游戲,自主調用海量工具技能

      今天,我們看到AI大模型賽道一個突出的趨勢,就是行業更在乎模型實際做事的能力,尤其是當AI開始深入產業、企業之后,公司更關心的是AI能否真正扛起任務、給公司創造生產力。

      從實際體驗效果來看,豆包2.0,是真的可以稱得上是企業級“超級AI牛馬”了,新模型在多模態理解、企業級Agent能力、推理和代碼編程方面的表現都令人印象深刻。

      企業級Agent和多模態能力方面,我們首先考察了一個常見場景:針對某一主題,匯總數據、制作表格、可視化分析、給出分析和策略建議。

      需求為:匯總梳理2025年1月1日至2025年12月31日發布的所有智能眼鏡產品,將產品名稱、發布日期、價格、廠商、主要參數配置、核心亮點匯總整理成表格,并據此生成可視化報告,至少要包括價格分布、產品發布數量趨勢、產品類型分布等,分析當前智能眼鏡市場發展特點,如果一家創業公司想要入局AI眼鏡市場,給出建議的市場策略。

      這個需求十分復雜,涉及Agent拆解復雜任務、自主多輪工具調用、多模態數據轉換、深度調研分析等多方面能力的考察。

      從最終呈現效果來看,豆包2.0制作的可視化網頁十分美觀、簡潔、重點突出,要點信息齊全,要素呈現直觀。


      同時,頁面信息匯總比較全、準確性較高、可用性較強,不論是產品名稱、價格還是產品特點,都提煉的較為準確,需要調整修改的地方并不多。


      AI給出的分析性內容邏輯性比較強,有一定深度,給出的結論和建議有根據出處,并非傳統AI生成常見的“假大虛空”內容。


      值得一提的是,這一復雜長程任務涉及公開信息收集梳理、用Python腳本創建可視化報告和圖表,涉及文字、圖像、表格、網頁等多模態數據的轉換,同時需要Agent自主調用大量工具,而豆包2.0完成任務的全程幾乎不需要干預,僅有必要的系統權限授權確認即可。


      此外,我們考察了Agent根據長文本內容生成指定主題PPT的能力,需求為:根據給定的一份萬字左右的會議紀要,生成一份關于季度銷售數據匯報的PPT,要求內容可視化程度高、數據呈現形象直觀,不要有大段文字,PPT風格簡約商務。


      從最終PPT生成效果來看,PPT制作的風格符合要求,同時在設計上比較簡約、美觀。


      最重要的是,其主要的數據均與會議紀要一致,數據準確,基本不需要調整修改。PPT中的圖表制作較為美觀,數據呈現直觀。


      此外,PPT整體的邏輯結構比較清晰,有頭有尾,結尾甚至用上了“凝心聚力”這樣的常用網紅熱詞。


      在圖文多模態內容轉換方面,我們還讓Agent根據一家企業財報的多個圖表(包括柱狀圖、折線圖、餅狀圖和文字表格),提取其中關鍵信息,生成關于財報數據的匯總表格,從呈現結果來看,其數據提取準確,可用性強。


      在企業級AI非常重視的代碼能力方面,我們使用TACE進行了測試。首先,我們直接提出了熱門的網頁游戲開發制作需求:

      從頭開發一款休閑卡通風格的“黃金礦工”游戲,游戲核心機制是擺動的鉤爪,玩家需要通過精準的時機預判來抓取不同重量和價值的物品,以此平衡風險與回報。核心功能要包括升級(鉤爪速度、炸藥、幸運值)關卡商店,游戲模式有帶BOSS戰的劇情模式、對戰模式、合作模式。游戲要有匹配的音效和動畫效果,最后直接以網頁版游戲形式呈現,要直接可玩。

      我們看到,Agent在收到需求后直接開始創建詳細的游戲開發計劃,梳理出8個待辦事項,并依次執行。在完成游戲設計后,Agent還測試并優化了游戲體驗,確保可以直接游玩。


      從最終游戲成品來看,黃金礦工游戲與我們印象中的經典版本十分接近。


      游戲完成度較高,從游戲玩法、核心功能、游戲模式到動效、音效都有比較好的呈現。


      Agent甚至自己給游戲添加了文本劇情說明,這是比較出彩的地方。整個游戲的畫面風格簡潔、直觀,操作比較流暢。


      交互項目設計方面,官方給出了更進一步的案例,基于TRAE,豆包2.0可以直接開發一個關于馬年廟會的互動項目,只需要1輪提示詞就能構建出基本的架構和場景,整個作品完成只需要5輪提示詞。


      ▲場景中,多位由大模型驅動的NPC回根據人設自然聊天,還會招攬顧客,甚至是砍價,AI游客們會自己逛廟會,場景中有煙花聲控、孔明燈題詞,均由AI即時生成,并且每次進入小鎮看到的互動都不相同

      除了游戲和交互項目設計,給公司制作指定主題的網站也是當前考驗Agent編程能力的一個關鍵項目,我們給Agent提出如下需求:

      為一家人工智能公司設計官方網站,融入地球主題元素。使用黑、白、藍、灰作為主色調,營造出酷炫、精致且充滿科技感的氛圍。我特別需要一個能讓用戶感到震撼的精美地球動畫。


      從網站呈現效果來看,最關鍵的“地球動效”的確有比較好的呈現,雖然與專業設計人工打造的動效還有一定差距,但整體視覺效果還是比較吸睛的,立體感十足,并且地球可以隨著鼠標運動,這是比較亮眼的。

      除了動效,網頁制作的基本元素、色調、氛圍都符合要求,并沒有出現明顯偏差,網站基本功能也都是完善的,包括公司愿景、口號、核心技術、成果等。整體來看,可用性較高,基本框架完全可以“拿來即用”了。


      在更進階的代碼能力方面,根據官方實測,豆包2.0還可以完成Solovay-Kitaev算法修復這樣的任務,這證明其具備數值分析直覺和幾何代數知識,具備數學推理與代碼修復的綜合能力。

      ▲Solovay-Kitaev算法修復

      此外,我們還考察了另一類企業常見的復雜任務:每日固定信息匯總梳理及可視化呈現。

      我們要求Agent提供過去24小時內科技領域的重點新聞摘要。每條新聞要提煉一個核心要點,并附帶網絡檢索來源,設計一個網頁呈現這些新聞,每個新聞都要有配圖,每個新聞的配圖,如果原文中有就用原文的,如果沒有,就生成一個適合的圖配上。

      從最終呈現結果來看,新聞抓取非常準確,時效性強,均為最近24小時內新聞,可用性強,并沒有出現其他Agent常見的用舊聞當新聞的錯誤。


      同時,網頁可以很好地還原需求,包括網絡檢索來源、清晰易讀、要點突出,整體網頁制作美觀度較高、有一定的設計感。

      值得一提的是,網頁中每個新的配圖都基本符合對應的新聞要素,AI生成圖片效果比較好。

      最后,在多模態能力方面,我們重點考察了Agent對于圖像的分析和理解能力,比如根據家中的幾個全景照片,給出新購置掃地機器人的合理擺放位置建議。

      Agent可以準確識別照片中的房間、家具,比如客廳、玄關、餐廳,沙發、餐桌、電視柜等,同時其給出的建議比較符合直覺(電視柜旁邊、沙發旁開闊區域,避開玄關和餐廳)。


      ▲家中環境照片


      ▲給出建議

      在圖像3D空間理解、分析方面,Agent可以根據一份零部件的三視圖,生成這個零部件的3D視圖,還原零件立體結構,描述零件的核心功能與裝配邏輯。


      ▲零部件三視圖


      ▲零部件結構功能分析

      Agent針對三視圖,可以準確分析零部件的結構組成,對核心功能的描述比較準確,數據單位使用都較為專業和正確,可用性較強。

      二、多項關鍵能力突破,讓企業級Agent走入現實

      從上述諸多實際體驗中,我們看到豆包2.0在多輪指令遵循、工具調用能力、數據和圖表處理、格式輸出穩定性等方面表現都比較突出,支持更靈活的上下文管理。

      模型在處理復雜任務中,自主進行各類工具的調用,執行復雜流程十分順利,整個過程需要極少介入,全流程自動,模型多Skills、復雜Skills準確調用能力比較強。


      這些特性都是企業級Agent所需要的關鍵能力,讓Agent可以更好地支持企業級復雜、長程任務,對于數據分析和客服Agent等企業場景,這些能力幾乎都是“剛需”。

      與此同時,模型在多模態感知、高精度文字提取、圖表理解、空間理解、運動理解、視覺知識和推理、長視頻理解等方面同樣表現出色,多模態能力的提升極大擴展了Agent能力的覆蓋范圍,也讓Agent的易用性大幅提升。

      在推理和代碼能力方面,模型的推理能力(規劃、思考、反思)有顯著增強,并且支持思考長度的調節,在各思考長度下,Tokens效率都有提升;模型的代碼能力,特別是前端開發能力有著令人印象深刻的表現。

      從實際基準測試成績來看,豆包2.0在考驗視覺推理及感知的MathVision等基準測試中達到SOTA水平,運動感知方面,豆包2.0強化了對時間序列與運動感知的理解能力,在MotionBench等測評中成績領先,此外,豆包2.0在指令遵循、復雜Agent能力評估中都已經達到業界第一梯隊水平。


      ▲豆包2.0在視覺推理及感知、運動感知、真實世界任務等方面的基準測試表現

      此外,豆包2.0在LLM、VLM、Agent等領域的任務評估中相較豆包1.8版本均有比較明顯的提升。

      三、AI從玩具走向工具,深入企業工作流

      字節CEO梁汝波曾在演講中點明企業級AI突破重要意義,以及字節對B端業務的理解和重要布局。

      當前,行業已經形成共識:AI助手已遠不止于搜索問答,從創作、生圖、生成視頻到強大的AI編程,AI快速擴展新場景。

      在梁汝波看來,除了面向C端的AI助手產品,ToB領域也存在重大機會,MaaS(模型即服務)是現在火山引擎發展最快的業務。


      ▲字節跳動CEO梁汝波

      從數據來看,已有超過100萬企業和個人使用了火山引擎的大模型服務,超過100家企業在火山引擎上累計Tokens使用量超過了1萬億。根據Gartner報告,2025年火山引擎在全球AI應用開發平臺的產品“執行能力”上,位于全球第五、中國第一。

      可以說,火山引擎AI云服務一直跑在行業前列。

      梁汝波提到,ToB業務對模型的長上下文、推理能力、代碼等能力有更高的要求,同時做好ToC助手和ToB MaaS,模型能力才更全面。

      豆包2.0此次的核心升級方向,正是字節重要AI業務策略的直觀體現。

      未來,企業級Agent的快速迭代升級必然會給更多行業帶來深遠影響,企業AI正從單一工具型AI進化為智能Agent型AI,而豆包2.0讓我們看到頂級多模態Agent在變革企業生產力范式方面所展現出的巨大價值。

      結語:超級AI打工人深入千行百業,企業生產力革命浪潮已至

      此次基于豆包2.0實現的Agent體驗令人驚艷,實際效果證明,AI是真的可以成為超級AI打工人,深入企業的。在諸多能力加持下,Agent已經不再是生產噱頭性內容的“玩具”,而是真正擁有變革生產力潛力的強大工具。

      回望近期AI大模型領域的發展,復雜長任務執行、多模態理解、出色代碼能力等Agent特性已經成為行業競爭焦點。

      在這樣的大背景下,字節火山引擎從圖像、視頻等領域的專業模型到企業級全能Agent模型全方位升級,構建了頗為扎實技術底盤,也在這場焦灼競賽中展露出自身的獨特優勢。

      毫無疑問,今天的火山引擎已經成為AI賦能企業轉型的核心推手。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      40.46%!春晚收視率創十年新高,打臉所有“春晚已死”的論調

      40.46%!春晚收視率創十年新高,打臉所有“春晚已死”的論調

      情感大頭說說
      2026-02-17 13:37:06
      1994 年,曾獲一等功的女志愿軍因重病住院,醫藥費耗盡了兒女的所有積蓄還欠了外債,無奈之下他們找到部隊,急切地哀求:“救救俺娘吧”

      1994 年,曾獲一等功的女志愿軍因重病住院,醫藥費耗盡了兒女的所有積蓄還欠了外債,無奈之下他們找到部隊,急切地哀求:“救救俺娘吧”

      史海孤雁
      2025-12-13 16:17:09
      叔叔送我一套單身公寓,10年后公寓漲到568萬,叔叔突然開口求助

      叔叔送我一套單身公寓,10年后公寓漲到568萬,叔叔突然開口求助

      黃小乖的日記
      2026-02-21 14:45:17
      48小時兩件大事攪動全球!美軍上將急呼:必須死死盯緊中國

      48小時兩件大事攪動全球!美軍上將急呼:必須死死盯緊中國

      兵器海陸空視頻
      2026-02-21 10:04:04
      81款主流耳機全軍覆沒:ToxFree檢測發現均含對人體有害化學物質

      81款主流耳機全軍覆沒:ToxFree檢測發現均含對人體有害化學物質

      IT之家
      2026-02-20 08:19:14
      百架戰機集結,中國雷達運往伊朗?美媒:不排除炮擊中俄艦的可能

      百架戰機集結,中國雷達運往伊朗?美媒:不排除炮擊中俄艦的可能

      面包夾知識
      2026-02-20 23:06:54
      騎士118-113黃蜂!無解的不是7連勝,是梅里爾談哈登帶來的一變化

      騎士118-113黃蜂!無解的不是7連勝,是梅里爾談哈登帶來的一變化

      魚崖大話籃球
      2026-02-21 12:35:19
      離開快船就爆發!換隊后場均9+7,得分翻3倍,他被泰倫盧坑慘了

      離開快船就爆發!換隊后場均9+7,得分翻3倍,他被泰倫盧坑慘了

      林子說事
      2026-02-21 20:13:21
      港府罕見通報:突發嚴重事故!

      港府罕見通報:突發嚴重事故!

      港漂圈
      2026-02-21 19:08:05
      比氫彈更可怕!僅需一枚就能讓美國從地球消失?聯合國曾緊急叫停

      比氫彈更可怕!僅需一枚就能讓美國從地球消失?聯合國曾緊急叫停

      詩酒趁的年華
      2026-02-20 11:07:15
      白天廣場,晚上“尸”地,廣州荔灣靈異事件全揭秘

      白天廣場,晚上“尸”地,廣州荔灣靈異事件全揭秘

      魏驚蟄
      2024-04-16 15:51:26
      連勝文、連勝武兩兄弟的老婆,一位是豪門千金,另一位是小家碧玉

      連勝文、連勝武兩兄弟的老婆,一位是豪門千金,另一位是小家碧玉

      顧史
      2026-01-25 19:32:37
      中國一生必去的12個地方,去過一半便不枉此生,你去過幾個?

      中國一生必去的12個地方,去過一半便不枉此生,你去過幾個?

      賞玩夜忘歸
      2026-02-16 01:30:03
      為何航母速度都在30節左右?30節換算成陸地交通工具,又是多快?

      為何航母速度都在30節左右?30節換算成陸地交通工具,又是多快?

      云上烏托邦
      2025-11-17 12:07:42
      被指袒護尹錫悅 韓國最大在野黨黨首遭“逼宮”

      被指袒護尹錫悅 韓國最大在野黨黨首遭“逼宮”

      財聯社
      2026-02-21 20:39:36
      她在柬埔寨7天被輪奸9次,被大陸解救,回臺灣后立馬抹黑大陸

      她在柬埔寨7天被輪奸9次,被大陸解救,回臺灣后立馬抹黑大陸

      李橑在北漂
      2026-02-09 16:13:50
      媽祖被換女孩發聲!許老板底細被扒,生意徹底黃了,道歉也無用

      媽祖被換女孩發聲!許老板底細被扒,生意徹底黃了,道歉也無用

      離離言幾許
      2026-02-21 20:36:15
      這就是赤裸裸的現實!越來越多央國企員工已經成了周末夫妻?

      這就是赤裸裸的現實!越來越多央國企員工已經成了周末夫妻?

      娛樂圈見解說
      2026-02-20 10:11:21
      央視劇《歲月有情時》首播收視第1,評價一針見血,心疼黃景瑜

      央視劇《歲月有情時》首播收視第1,評價一針見血,心疼黃景瑜

      書寫傳奇
      2026-02-20 22:38:05
      遠華集團老總賴昌星,在獄中對董文華的回憶,讓無數人咋舌

      遠華集團老總賴昌星,在獄中對董文華的回憶,讓無數人咋舌

      曉艾故事匯
      2025-01-09 22:01:49
      2026-02-21 23:36:49
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      11245文章數 116973關注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      立陶宛總統繼續"嘴硬":不會跪下認錯 中方要展現誠意

      頭條要聞

      立陶宛總統繼續"嘴硬":不會跪下認錯 中方要展現誠意

      體育要聞

      冬奧第一"海王"?一人和13國選手都有關系

      娛樂要聞

      鏢人反超驚蟄無聲拿下單日票房第二!

      財經要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態度原創

      教育
      藝術
      房產
      公開課
      軍事航空

      教育要聞

      本科生畢業進工廠,薪資趕超互聯網

      藝術要聞

      投資14.5億!鄰水縣奧體中心,施工規模顯現!

      房產要聞

      窗前即地標!獨占三亞灣C位 自貿港總裁行宮亮相

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      硬核揭秘!福建艦“一馬當先”底氣何在

      無障礙瀏覽 進入關懷版