Meta Muse Spark 引入并行推理智能體與多模態(tài) AI,聲稱效率提升達(dá)十倍。
![]()
Meta 已正式推出 Muse Spark,這款全新人工智能模型標(biāo)志著其 AI 戰(zhàn)略的重新調(diào)整。
該模型是 Meta 超級(jí)智能實(shí)驗(yàn)室發(fā)布的首款成果,融合了多模態(tài)推理能力與智能體式任務(wù)執(zhí)行方式。
此次發(fā)布正值各大科技公司競(jìng)相定義聊天機(jī)器人之后 AI 的下一階段。
與此前模型不同,Muse Spark 能夠在單一框架內(nèi)同時(shí)處理文本、圖像及工具調(diào)用。
該系統(tǒng)還首次引入多個(gè)推理智能體并行運(yùn)作的機(jī)制。
Meta 表示,這一設(shè)計(jì)能提升解決復(fù)雜問題的表現(xiàn),不過公司也承認(rèn)目前仍存在不足。
Muse Spark 折射出更廣泛的行業(yè)轉(zhuǎn)向——即構(gòu)建能夠解讀并依據(jù)視覺與現(xiàn)實(shí)世界數(shù)據(jù)采取行動(dòng)的系統(tǒng)。
該模型可分析圖像、解答視覺類 STEM 問題,并能結(jié)合上下文理解來識(shí)別物體。它還能對(duì)視覺輸入進(jìn)行逐步推理,Meta 將此功能描述為“視覺思維鏈”。這些能力支撐起更具實(shí)用性的應(yīng)用場(chǎng)景。
用戶可讓系統(tǒng)排查家電故障,或借助帶標(biāo)注的視覺指引完成操作步驟。模型還可生成交互式內(nèi)容,包括基于用戶提示構(gòu)建的簡(jiǎn)易小游戲。不過,此類功能在行業(yè)內(nèi)仍表現(xiàn)參差不齊。
盡管各公司都在強(qiáng)調(diào)多模態(tài)方面的進(jìn)步,但穩(wěn)定的真實(shí)世界表現(xiàn)依然落后于受控基準(zhǔn)測(cè)試結(jié)果。
并行智能體,更高風(fēng)險(xiǎn)
Meta 引入的一項(xiàng)關(guān)鍵功能名為“沉思模式”。該模式可讓多個(gè)推理智能體并行運(yùn)行,旨在更有效地處理更困難的任務(wù)。
此舉與競(jìng)爭(zhēng)對(duì)手通過在推理階段增加算力投入以擴(kuò)展推理能力的做法相呼應(yīng)。
據(jù) Meta 披露,Muse Spark 在“人類終極考試”基準(zhǔn)上得分為 58%,在“前沿科學(xué)研究”任務(wù)上得分為 38%。
這些基準(zhǔn)旨在評(píng)估模型應(yīng)對(duì)復(fù)雜推理問題的表現(xiàn)。
然而,由于各家評(píng)估方法不同,此類分?jǐn)?shù)在不同模型間難以直接比較。
公司表示,該系統(tǒng)在未降低回應(yīng)多樣性的前提下提升了可靠性。
并稱其在訓(xùn)練數(shù)據(jù)覆蓋范圍之外的任務(wù)上同樣取得增益。針對(duì)這些說法的獨(dú)立驗(yàn)證仍然有限。
規(guī)模效率成為焦點(diǎn)
本次發(fā)布背后是一輪更大規(guī)模的基礎(chǔ)設(shè)施調(diào)整。Meta 稱在過去九個(gè)月內(nèi)重構(gòu)了訓(xùn)練流程,重點(diǎn)聚焦模型設(shè)計(jì)、優(yōu)化與數(shù)據(jù)篩選。
公司宣稱,這些改動(dòng)使 Muse Spark 在達(dá)到相近性能水平時(shí)所需的計(jì)算量遠(yuǎn)低于此前系統(tǒng)。
根據(jù) Meta 說法,相較于其前代 Llama 4 Maverick 模型,Muse Spark 用不足十分之一的算力便實(shí)現(xiàn)了可比的成果。
若該數(shù)據(jù)準(zhǔn)確無誤,這一效率提升有望降低開發(fā)更大型 AI 系統(tǒng)的成本。
強(qiáng)化學(xué)習(xí)仍是該方法的核心。
Meta 報(bào)告稱,隨著訓(xùn)練規(guī)模的擴(kuò)大,模型在訓(xùn)練任務(wù)與評(píng)估任務(wù)上均持續(xù)穩(wěn)步提升。公司認(rèn)為這表明相較于早期方法常見的性能不穩(wěn)定問題,當(dāng)前進(jìn)展更具可預(yù)測(cè)性。
Meta 將 Muse Spark 定位為實(shí)現(xiàn)所謂“個(gè)人超級(jí)智能”的早期一步。該愿景的核心是讓 AI 系統(tǒng)理解用戶所處環(huán)境并提供個(gè)性化輔助。
健康領(lǐng)域是首批重點(diǎn)方向之一,相關(guān)訓(xùn)練數(shù)據(jù)與醫(yī)生合作開發(fā),旨在優(yōu)化醫(yī)學(xué)解釋能力。
Muse Spark 現(xiàn)已在 Meta 的 AI 平臺(tái)上線,并向開發(fā)者提供有限的 API 訪問權(quán)限。
此次發(fā)布凸顯出 AI 競(jìng)爭(zhēng)焦點(diǎn)的轉(zhuǎn)移。企業(yè)不再僅僅打造更聰明的模型,而是在構(gòu)建旨在真實(shí)世界中運(yùn)作的系統(tǒng)——即便可靠性與驗(yàn)證仍是懸而未決的問題。
如果朋友們喜歡,敬請(qǐng)關(guān)注“知新了了”!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.