11 月 13 日 2025 百度世界大會上,百度正式推出原生全模態大模型文心 5.0,2.4 萬億參數量搭配統一建模技術,直接將國內大模型競爭拉至全球頂尖水準,這波技術迭代不止是參數升級,更是對 AI 使用場景的全面拓寬。
![]()
不同于多數模型的 “后期融合” 套路,文心 5.0 從訓練之初就打通文本、圖像、音頻、視頻等多模態數據,用統一自回歸架構實現 “理解與生成一體化”。這意味著它不用在不同模態間 “切換適配”,處理圖文結合的創意寫作、音視頻內容解析時,流暢度和精準度遠超傳統模型,比如生成短視頻腳本時能同步匹配畫面描述,解析會議錄音時可自動提取圖文關鍵信息。
硬實力有權威評測背書:在 40 余項全球基準測試中,其語言與多模態理解能力看齊 Gemini-2.5-Pro、GPT-5-High,圖像與視頻生成能力比肩垂直專精模型;此前 LMArena 排名中,它還拿下文本任務中國第一、全球并列第二的成績,創意寫作和復雜問題理解尤為突出。
更難得的是 “強能力 + 高效率” 兼顧,采用超稀疏混合專家架構,激活參數占比低于 3%,既保證了 2.4 萬億參數的算力支撐,又提升了推理速度,避免了 “大而笨重” 的痛點。同時通過強化學習訓練,智能體規劃和工具調用能力顯著提升,不管是普通用戶日常交互,還是企業級復雜任務處理,都能高效適配。
目前文心 5.0 Preview 已上線文心 App,開發者和企業可通過百度千帆平臺調用 API,普通人能直接體驗全模態生成、創意寫作等功能,企業則可基于其搭建專屬應用。
在我看來,文心 5.0 的核心突破不是參數數字,而是 “原生全模態” 帶來的場景革命 ——AI 終于能像人類一樣 “綜合解讀多元信息”,這讓它從 “專業工具” 變成 “全民助手”。對創意從業者來說,圖文音視頻一體化生成能節省大量時間;對企業而言,全模態理解能力可賦能客服、營銷、研發等多個環節。隨著這類原生全模態模型落地,AI 與日常工作生活的融合會更自然,真正走進 “萬物皆可智能” 的新階段。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.