網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Meta發(fā)布MuseSpark AI：?jiǎn)我豢蚣芴幚砦谋九c視覺，計(jì)算量減至1/10

2026-04-09 12:33:17　來源: 知新了了

北京舉報(bào)

分享至

Meta Muse Spark 引入并行推理智能體與多模態(tài) AI，聲稱效率提升達(dá)十倍。

Meta 已正式推出 Muse Spark，這款全新人工智能模型標(biāo)志著其 AI 戰(zhàn)略的重新調(diào)整。

該模型是 Meta 超級(jí)智能實(shí)驗(yàn)室發(fā)布的首款成果，融合了多模態(tài)推理能力與智能體式任務(wù)執(zhí)行方式。

此次發(fā)布正值各大科技公司競(jìng)相定義聊天機(jī)器人之后 AI 的下一階段。

與此前模型不同，Muse Spark 能夠在單一框架內(nèi)同時(shí)處理文本、圖像及工具調(diào)用。

該系統(tǒng)還首次引入多個(gè)推理智能體并行運(yùn)作的機(jī)制。

Meta 表示，這一設(shè)計(jì)能提升解決復(fù)雜問題的表現(xiàn)，不過公司也承認(rèn)目前仍存在不足。

Muse Spark 折射出更廣泛的行業(yè)轉(zhuǎn)向——即構(gòu)建能夠解讀并依據(jù)視覺與現(xiàn)實(shí)世界數(shù)據(jù)采取行動(dòng)的系統(tǒng)。

該模型可分析圖像、解答視覺類 STEM 問題，并能結(jié)合上下文理解來識(shí)別物體。它還能對(duì)視覺輸入進(jìn)行逐步推理，Meta 將此功能描述為“視覺思維鏈”。這些能力支撐起更具實(shí)用性的應(yīng)用場(chǎng)景。

用戶可讓系統(tǒng)排查家電故障，或借助帶標(biāo)注的視覺指引完成操作步驟。模型還可生成交互式內(nèi)容，包括基于用戶提示構(gòu)建的簡(jiǎn)易小游戲。不過，此類功能在行業(yè)內(nèi)仍表現(xiàn)參差不齊。

盡管各公司都在強(qiáng)調(diào)多模態(tài)方面的進(jìn)步，但穩(wěn)定的真實(shí)世界表現(xiàn)依然落后于受控基準(zhǔn)測(cè)試結(jié)果。

并行智能體，更高風(fēng)險(xiǎn)

Meta 引入的一項(xiàng)關(guān)鍵功能名為“沉思模式”。該模式可讓多個(gè)推理智能體并行運(yùn)行，旨在更有效地處理更困難的任務(wù)。

此舉與競(jìng)爭(zhēng)對(duì)手通過在推理階段增加算力投入以擴(kuò)展推理能力的做法相呼應(yīng)。

據(jù) Meta 披露，Muse Spark 在“人類終極考試”基準(zhǔn)上得分為 58%，在“前沿科學(xué)研究”任務(wù)上得分為 38%。

這些基準(zhǔn)旨在評(píng)估模型應(yīng)對(duì)復(fù)雜推理問題的表現(xiàn)。

然而，由于各家評(píng)估方法不同，此類分?jǐn)?shù)在不同模型間難以直接比較。

公司表示，該系統(tǒng)在未降低回應(yīng)多樣性的前提下提升了可靠性。

并稱其在訓(xùn)練數(shù)據(jù)覆蓋范圍之外的任務(wù)上同樣取得增益。針對(duì)這些說法的獨(dú)立驗(yàn)證仍然有限。

規(guī)模效率成為焦點(diǎn)

本次發(fā)布背后是一輪更大規(guī)模的基礎(chǔ)設(shè)施調(diào)整。Meta 稱在過去九個(gè)月內(nèi)重構(gòu)了訓(xùn)練流程，重點(diǎn)聚焦模型設(shè)計(jì)、優(yōu)化與數(shù)據(jù)篩選。

公司宣稱，這些改動(dòng)使 Muse Spark 在達(dá)到相近性能水平時(shí)所需的計(jì)算量遠(yuǎn)低于此前系統(tǒng)。

根據(jù) Meta 說法，相較于其前代 Llama 4 Maverick 模型，Muse Spark 用不足十分之一的算力便實(shí)現(xiàn)了可比的成果。

若該數(shù)據(jù)準(zhǔn)確無誤，這一效率提升有望降低開發(fā)更大型 AI 系統(tǒng)的成本。

強(qiáng)化學(xué)習(xí)仍是該方法的核心。

Meta 報(bào)告稱，隨著訓(xùn)練規(guī)模的擴(kuò)大，模型在訓(xùn)練任務(wù)與評(píng)估任務(wù)上均持續(xù)穩(wěn)步提升。公司認(rèn)為這表明相較于早期方法常見的性能不穩(wěn)定問題，當(dāng)前進(jìn)展更具可預(yù)測(cè)性。

Meta 將 Muse Spark 定位為實(shí)現(xiàn)所謂“個(gè)人超級(jí)智能”的早期一步。該愿景的核心是讓 AI 系統(tǒng)理解用戶所處環(huán)境并提供個(gè)性化輔助。

健康領(lǐng)域是首批重點(diǎn)方向之一，相關(guān)訓(xùn)練數(shù)據(jù)與醫(yī)生合作開發(fā)，旨在優(yōu)化醫(yī)學(xué)解釋能力。

Muse Spark 現(xiàn)已在 Meta 的 AI 平臺(tái)上線，并向開發(fā)者提供有限的 API 訪問權(quán)限。

此次發(fā)布凸顯出 AI 競(jìng)爭(zhēng)焦點(diǎn)的轉(zhuǎn)移。企業(yè)不再僅僅打造更聰明的模型，而是在構(gòu)建旨在真實(shí)世界中運(yùn)作的系統(tǒng)——即便可靠性與驗(yàn)證仍是懸而未決的問題。

如果朋友們喜歡，敬請(qǐng)關(guān)注“知新了了”！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.