數據是個寶
投資少煩惱
在這個春節的“群模大戰”中,作為“多模態AI王者”的字節跳動,接連驚艷市場。
2月14日,字節火山引擎發布豆包大模型2.0(Doubao-Seed-2.0)。據介紹,這是字節跳動最新推出的多模態Agent(智能體)模型,也是豆包大模型自2024年5月正式發布以來首次大版本的跨代升級。豆包大模型2.0具有更穩健的視覺與多模態理解、更可靠的復雜指令執行、更快速更靈活的推理選擇三大核心亮點。目前,豆包2.0 Pro和Code模型已分別在豆包App和TRAE上線,同時,豆包2.0全系列模型API已同步上線火山引擎。
值得注意的是,在豆包2.0正式發布之前,豆包視頻生成模型Seedance 2.0、豆包圖像創作模型Seedream 5.0 Lite已分別在2月12日、2月13日正式發布。其中,視頻生成模型Seedance 2.0更是全球爆火,以“1分鐘生成好萊塢級大片”的炸裂效果,在海外輿論場引發轟動,并引爆了A股AI應用、文化傳媒、短劇游戲等板塊行情。
在業內人士看來,“基礎模型+視頻生成模型+圖像創作模型”三大模型的跨代升級,彰顯了字節跳動在多模態AI領域的技術領跑與全鏈路布局優勢。
三大亮點,性能與智能水平再突破
2月14日,豆包大模型2.0正式發布。據字節Seed團隊介紹,豆包2.0具有三大亮點:
一是更穩健的視覺與多模態理解:豆包2.0強化了視覺感知與推理能力,對復雜文檔、表格、圖形、視頻內容的解析水平顯著提升,視覺信息處理更精準。
二是更可靠的復雜指令執行:豆包2.0提升了指令遵循和推理表現,并強化了對多約束、多步驟、長鏈路任務的理解與執行能力,已具備支撐高價值任務的能力基礎。
三是更快速、更靈活的推理選擇:豆包2.0提供 Pro、Lite、Mini 三款不同尺寸的通用Agent模型,以及專門的Code模型,覆蓋不同的場景需求,供企業和開發者選擇。
豆包2.0全面升級了多模態能力,在各類視覺理解任務上均達到業界頂尖水平,其視覺推理、感知能力、空間推理與長上下文理解能力表現尤為突出,豆包2.0 Pro在大多數相關基準測試中取得了最高分數。
記者實測發現,豆包2.0在圖片識別與理解、智能分析等方面表現優秀。例如,當記者輸入一張蛋糕圖片,詢問圖片中有幾朵玫瑰、分別是什么顏色時,豆包2.0能精準羅列三類不同的玫瑰花色,并介紹其中一種漸變色的玫瑰為愛莎玫瑰品種。值得注意的是,豆包2.0還識別出其中一朵為洋桔梗,并未受到問題的誤導。
![]()
“三箭”齊發,多模態能力全面升級
“太震撼了,Seedance 2.0的熱度還沒退卻,全新的圖像生成模型又登場,把AI生圖從‘炫技玩具’變成了‘生產力神器’。”在體驗了豆包圖像創作模型Seedream 5.0 Lite后,一名AI創業公司的創始人如此感嘆。
兩年前的春節期間,Open AI的Sora橫空出世;去年8月,谷歌推出的爆款圖像編輯產品Nano Banana火遍全網。而此次豆包大模型的一系列重要升級,不僅涵蓋了豆包大模型2.0,還包括此前發布的視頻生成模型Seedance 2.0和圖像創作模型Seedream 5.0 Lite。“三箭”齊發,實現多模態 Agent、AI 圖像、AI視頻創作全維度技術突破,被業界視為“槍挑Sora、硬剛Nano Banana”, 彰顯了字節跳動在多模態AI領域的技術領跑與全鏈路布局優勢。
無論是Seedance 2.0還是Seedream 5.0 Lite,都更加注重實用性與易用性,以跨模態理解與參考為核心特色,賦予創作者更高的自由度。
以Seedream 5.0 Lite為例,得益于跨模態理解能力的提升,用戶無需再絞盡腦汁寫復雜的提示詞,只需輸入一張參考圖,簡單描述需求,模型就能理解并生成所需的圖片風格。例如,向模型輸入兩張圖片,簡單撰寫提示詞“把圖1色調改成圖2的色調”,模型就能精準理解用戶意圖,生成圖3的風格圖片,極大地降低了創作門檻。
![]()
除了更強的理解和推理能力外,Seedream 5.0 Lite還具備實時檢索能力,支持聯網檢索。例如,近期貴金屬價格波動引發廣泛關注,模型能基于實時檢索結果,繪制出用戶指定日期時段的金價走勢圖。
![]()
Seedance 2.0更是以“導演級AI”的視頻生成模型,讓視頻生成“所想即所見”。用戶只需要根據自己的創意構思,編寫包含人物、構圖、動作、運鏡、對白等要求的詳細提示詞,或者上傳相應參考圖片,就可以得到帶有原生音頻的多鏡頭序列視頻。
例如,當記者輸入“幫我生成一個視頻:在第一次華山論劍中,大熊貓和大猩猩切磋武藝。模型2.0,比例 16:9,時長 15s”的簡單提示詞后,一個可媲美動漫電影制作效果的視頻便隨即生成。
不少影視、短劇、游戲行業從業者在使用Seedance 2.0后,都表示“人均導演的時代到來了”。知名導演賈樟柯也在個人微博賬號發文稱:“Seedance 2.0確實厲害,我準備用它做個短片。 ”
![]()
引爆應用,產業鏈上下游同步受益
豆包大模型此次的系列重要升級,以卓越的性能、極強的多模態能力以及高度的可用性,引發業界廣泛關注。業內評價,豆包大模型提供了一種極具成本效益的多模態大模型解決方案,推動前沿AI技術在千行百業規模化應用。
對于產業鏈而言,在豆包大模型的帶動下,短視頻營銷、電商素材、AI漫劇、游戲制作、數字內容創作等下游應用場景需求有望迎來爆發。同時,華泰證券研報認為,AI極大降低了文字IP向視頻內容轉化的門檻,海量優質IP儲備的公司將直接受益,上游IP方數字資產有望重估;中游制作方中,看好能高效結合AI工具賦能內容創作的公司,特別是擁有稀缺導演/編劇資源的公司。
此外,由于AI的規模化應用依賴強大的算力支持,伴隨豆包大模型多模態能力全面落地與內容創作場景爆發,云端訓練與推理算力需求將持續走高,有望帶動AI 芯片、智能服務器、云計算服務等上游算力環節快速增長。
值得注意的是,字節跳動通過火山引擎對外提供豆包大模型服務,是豆包系列模型產業落地的核心載體。最新數據顯示,截至2025年12月,豆包大模型日均使用量突破63萬億 Tokens,居中國第一、全球第三。2025年上半年,火山引擎在中國公有云上大模型調用量市場份額占比達49.2%。豆包大模型的重要升級,也將鞏固火山引擎在AI云市場的領先地位,推動AI能力在各行各業的深度落地。
來源:證券時報官微
聲明:數據寶所有資訊內容不構成投資建議,股市有風險,投資需謹慎。
責編:林麗峰
校對:祝甜婷
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.