2.4萬億參數(shù)原生全模態(tài)大模型，文心5.0正式版上線

2026-01-22 13:12:57　來源: 首席商業(yè)評論

浙江舉報

分享至

1月22日，百度發(fā)布并上線原生全模態(tài)大模型文心5.0正式版。該模型參數(shù)達2.4萬億，采用原生全模態(tài)統(tǒng)一建模技術(shù)，具備全模態(tài)理解與生成能力，支持文本、圖像、音頻、視頻等多種信息的輸入與輸出。目前，個人用戶可在文心APP、文心一言官網(wǎng)體驗，企業(yè)與開發(fā)者可通過百度千帆平臺進行調(diào)用。

在40余項權(quán)威基準的綜合評測中，文心5.0正式版的語言與多模態(tài)理解能力超越Gemini-2.5-Pro、GPT-5-High等模型，穩(wěn)居國際第一梯隊。圖像與視頻生成能力與垂直領(lǐng)域?qū)＞Ｐ拖喈敚w處于全球領(lǐng)先水平。

百度集團副總裁、深度學習技術(shù)及應(yīng)用國家工程研究中心副主任吳甜介紹，與業(yè)界多數(shù)采用“后期融合”的多模態(tài)方案不同，文心5.0的技術(shù)路線采用統(tǒng)一的自回歸架構(gòu)進行原生全模態(tài)建模，將文本、圖像、視頻、音頻等多源數(shù)據(jù)在同一模型框架中進行聯(lián)合訓練，使得多模態(tài)特征在統(tǒng)一架構(gòu)下充分融合并協(xié)同優(yōu)化，實現(xiàn)原生的全模態(tài)統(tǒng)一理解與生成。

此外，文心5.0采用超大規(guī)模混合專家結(jié)構(gòu)，具備超稀疏激活參數(shù)，激活參數(shù)比低于3%，在保持模型強大能力的同時，有效提升推理效率。同時，基于大規(guī)模工具環(huán)境，合成長程任務(wù)軌跡數(shù)據(jù)，并采用基于思維鏈和行動鏈的端到端多輪強化學習訓練，顯著提升了模型的智能體和工具調(diào)用能力。

得益于原生全模態(tài)建模，文心5.0在多模理解、代碼、創(chuàng)意寫作等能力上實現(xiàn)顯著突破。大會現(xiàn)場，僅輸入一段博主復(fù)刻“活了么”App教程視頻，文心5.0便能自動拆解步驟，理解核心交互邏輯，并直接生成可運行的前端代碼。在創(chuàng)意寫作任務(wù)中，還能模擬《紅樓夢》中王熙鳳的語言風格，生成融合古典語境與現(xiàn)代商業(yè)邏輯的“大觀園資產(chǎn)重組方案”，展現(xiàn)出較強的情境理解與創(chuàng)作能力。

吳甜現(xiàn)場介紹了“文心導(dǎo)師”計劃的最新進展。文心導(dǎo)師隊伍持續(xù)壯大，目前已吸納835位來自科技、金融、文化、教育、醫(yī)療、能源等十余個重點行業(yè)以及數(shù)理化生文史哲等學科的專家，在知識傳授、鑒賞評價、專業(yè)校準方面對大模型進行指導(dǎo)，幫助模型在邏輯嚴謹性、專業(yè)深度、創(chuàng)意質(zhì)量和價值觀對齊等方面不斷精進。

有分析認為，文心5.0正式版的上線，意味著原生全模態(tài)技術(shù)路線逐漸走向成熟與實用，體現(xiàn)了中國模型廠商在多模態(tài)大模型底層自主創(chuàng)新能力，有助于進一提升中國AI在全球AI產(chǎn)業(yè)競爭中的技術(shù)話語權(quán)。

據(jù)了解，2025年11月，百度發(fā)布文心大模型5.0并上線Preview版本。此后，文心5.0系列模型多次登上LMArena全球大模型競技場，多次位居文本榜和視覺理解榜國內(nèi)第一，躋身國際第一梯隊。1月15日，文心5.0以1460分位列LMArena文本榜國內(nèi)第一、全球第八，超過GPT-5.1-High、Gemini-2.5-Pro等多款國內(nèi)外主流模型。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.