<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      扎克伯格重開(kāi)一局

      0
      分享至

      文 | 強(qiáng)調(diào)Next

      這是過(guò)去一年里Meta最需要一個(gè)好消息的時(shí)刻。Llama4的基準(zhǔn)造假丑聞讓開(kāi)發(fā)者社區(qū)徹底寒了心,旗艦項(xiàng)目Behemoth遲遲沒(méi)有下文,與此同時(shí)OpenAI、Anthropic和Google的軍備競(jìng)賽越打越猛。

      扎克伯格今天把Muse Spark推到了臺(tái)前。

      這是Meta超級(jí)智能實(shí)驗(yàn)室(MSL)交出的第一份答卷,也是汪韜(Alexandr Wang)加入Meta九個(gè)月后,第一次向外界證明這筆143億美元的賭注沒(méi)有白下。發(fā)布當(dāng)日,Meta股價(jià)盤(pán)中最高漲超10%,收漲約9%,市場(chǎng)給出了它想看到的那個(gè)答案。

      一、九個(gè)月,從廢墟里蓋起來(lái)

      要理解Muse Spark,先得理解它是怎么來(lái)的。

      去年夏天,Llama4的基準(zhǔn)測(cè)試被抓了現(xiàn)行:Meta承認(rèn)拿了針對(duì)特定任務(wù)微調(diào)的專(zhuān)用版本去刷分,普通用戶(hù)能用到的那個(gè),跟公布的數(shù)據(jù)壓根對(duì)不上。這件事對(duì)Meta AI的品牌傷害不小,但更深的問(wèn)題在于,就算沒(méi)有造假,Llama4也沒(méi)能在前沿模型序列里站穩(wěn)腳跟。

      扎克伯格再次推倒重來(lái)。

      他找來(lái)了時(shí)年29歲的Scale AI聯(lián)合創(chuàng)始人汪韜,花143億美元買(mǎi)下Scale AI 49%的非投票股權(quán),把汪韜塞進(jìn)Meta首席AI官的位置,同時(shí)成立Meta超級(jí)智能實(shí)驗(yàn)室,從OpenAI、Anthropic、Google高薪挖人,據(jù)報(bào)道部分研究員的薪酬包含股權(quán)在內(nèi)達(dá)到數(shù)億美元。

      然后是整整九個(gè)月的沉默。

      汪韜在X上寫(xiě)道:“九個(gè)月前,我們從零開(kāi)始重建了AI技術(shù)棧。新的基礎(chǔ)設(shè)施、新的架構(gòu)、新的數(shù)據(jù)流水線?!辈皇窃谠谢A(chǔ)上打補(bǔ)丁,是字面意義上的重頭來(lái)過(guò)。


      結(jié)果就是Muse Spark。內(nèi)部代號(hào)Avocado,是Meta新Muse系列的首個(gè)型號(hào),定位輕量、快速,但具備完整的推理能力。

      二、“思維壓縮”:效率才是真正的護(hù)城河

      Muse Spark最讓人意外的數(shù)字,不是某個(gè)基準(zhǔn)測(cè)試的排名,而是計(jì)算效率。

      Meta聲稱(chēng),Muse Spark達(dá)到Llama4 Maverick同等性能水平所需的計(jì)算量,減少了十倍以上。背后是一種叫做“思維壓縮(Thought Compression)”的訓(xùn)練技術(shù):在強(qiáng)化學(xué)習(xí)階段,對(duì)模型過(guò)度思考的行為施加懲罰,迫使它用更少的推理token解決同樣的問(wèn)題,同時(shí)不犧牲準(zhǔn)確率。


      這件事的戰(zhàn)略意義比表面看起來(lái)大得多。

      AI軍備競(jìng)賽進(jìn)入2026年,算力成本依然是最核心的約束之一。Meta今年的AI基礎(chǔ)設(shè)施支出上限調(diào)至1350億美元,比上年幾乎翻倍。但光砸錢(qián)不夠,燒得更高效才是差異點(diǎn)。如果十分之一的計(jì)算量能跑出同等智力水平,那意味著同樣的預(yù)算可以跑更多次實(shí)驗(yàn)、迭代更多代模型。

      從這個(gè)角度看,“思維壓縮”不只是一個(gè)技術(shù)細(xì)節(jié),它意味著這套新架構(gòu)是可以規(guī)?;?。

      三、偏科的“視覺(jué)天才”

      評(píng)估一個(gè)新模型,先看它的長(zhǎng)板和短板分別在哪里。Muse Spark的性格相當(dāng)鮮明。

      長(zhǎng)板:多模態(tài)與健康

      第三方機(jī)構(gòu)Artificial Analysis的獨(dú)立評(píng)測(cè),給Muse Spark打出了52分(滿(mǎn)分參照系中),在Intelligence Indexv 4.0排名第四,位列Gemini3.1 Pro(57)、GPT-5.4(57)和Claude Opus4.6(53)之后。

      但在具體科目上,Muse Spark的多模態(tài)能力是真實(shí)的強(qiáng)項(xiàng)。視覺(jué)理解(MMMU-Pro)排名第二,得80.5,僅次于Gemini 3.1 Pro的82.4。圖表推理(CharXiv Reasoning)得86.4,力壓Gemini的80.2和GPT-5.4的82.8,全場(chǎng)第一。

      Health Bench Hard上,Muse Spark拿了42.8,超過(guò)GPT-5.4的40.1,把Gemini 3.1 Pro的20.6甩開(kāi)一大截。Meta號(hào)稱(chēng)與超過(guò)1000名醫(yī)生合作,專(zhuān)門(mén)為健康場(chǎng)景定制了訓(xùn)練數(shù)據(jù)。


      短板:邏輯推理與代碼

      然后是短板,同樣明顯。

      ARCAGI 2(抽象推理):Muse Spark得42.5,而Gemini 3.1 Pro得76.5,GPT-5.4得76.1。差距將近一倍,這個(gè)分布不像是追分的問(wèn)題,更像是架構(gòu)層面的結(jié)構(gòu)性缺口。

      終端編程(Terminal-Bench2.0):Muse Spark得59.0,GPT-5.4是75.1,Gemini是68.5。Meta自己的技術(shù)博客里也直接承認(rèn),“長(zhǎng)程agentic系統(tǒng)和代碼工作流”是當(dāng)前的重點(diǎn)投入方向。

      三級(jí)推理模式

      模型提供三種模式:Instant(即時(shí))、Thinking(思考)、Contemplating(沉思)。Contemplating模式最有意思——它并行啟動(dòng)多個(gè)子智能體,分頭處理任務(wù)再綜合結(jié)論。Meta宣稱(chēng)在這個(gè)模式下,HLE(人類(lèi)最后考試)得分達(dá)到58%,F(xiàn)rontier Science Research達(dá)到38%,能跟Gemini DeepThink和GPT Pro在同一個(gè)場(chǎng)上競(jìng)爭(zhēng)。


      值得一提的是,Muse Spark的token效率也很出色。在Intelligence Index測(cè)評(píng)中使用了約5800萬(wàn)輸出token,與Gemini 3.1 Pro相當(dāng),遠(yuǎn)低于Claude Opus4.6的1.57億。

      四、深水炸彈:這對(duì) DeepSeek 意味著什么?

      Muse Spark 走向閉源,不僅是 Meta 的轉(zhuǎn)型,更是全球 AI 生態(tài)的一次大洗牌。首當(dāng)其沖的,就是一直以“開(kāi)源高效率”著稱(chēng)的 DeepSeek。

      DeepSeek 此前憑借極致的算力利用率在開(kāi)源界封神,但 Muse Spark 提出的“思維壓縮”直接在閉源側(cè)把效率拉到了新高度。如果閉源模型不僅智力更強(qiáng),連推理成本都下探到開(kāi)源模型的水平,DeepSeek 這種“平替”的性?xún)r(jià)比優(yōu)勢(shì)將被大幅削弱。

      當(dāng)然,Meta 撤出開(kāi)源,意味著開(kāi)源界失去了一根定海神針。這給 DeepSeek 留下了巨大的市場(chǎng)空間去接管那些“被背叛”的開(kāi)發(fā)者,但同時(shí)也讓 DeepSeek 陷入了孤軍奮戰(zhàn)。沒(méi)有了 Llama 作為行業(yè)標(biāo)準(zhǔn),DeepSeek 必須獨(dú)自面對(duì)閉源巨頭們更厚的技術(shù)壁壘。

      不過(guò),汪韜主導(dǎo)的這次重建,在多模態(tài)融合和推理效率上的思路,與 DeepSeek 追求的方向高度重合。這意味著接下來(lái)的競(jìng)賽將不再是“開(kāi)源 vs 閉源”的意識(shí)形態(tài)之爭(zhēng),而是純粹的、關(guān)于“誰(shuí)能用更少的卡跑出更強(qiáng)的智力”的終極對(duì)決。

      五、最大的新聞:開(kāi)源時(shí)代結(jié)束了

      從2023年開(kāi)始,Llama系列是硅谷“開(kāi)源AI”的精神圖騰。開(kāi)發(fā)者靠Llama做了無(wú)數(shù)應(yīng)用,學(xué)術(shù)界用它做研究,初創(chuàng)公司用它起家,甚至競(jìng)爭(zhēng)對(duì)手也拿它作為參照系。Meta在這件事上賺到的品牌資產(chǎn),是其AI業(yè)務(wù)最重要的護(hù)城河之一。

      Muse Spark放棄了這個(gè)護(hù)城河。

      官方說(shuō)法很溫和:“我們希望未來(lái)版本能夠開(kāi)源?!钡珱](méi)有時(shí)間表,沒(méi)有承諾,沒(méi)有框架。當(dāng)下這個(gè)版本,只能通過(guò)MetaAI應(yīng)用、meta.ai網(wǎng)站使用,部分合作伙伴可以申請(qǐng)API私測(cè)資格。架構(gòu)和權(quán)重不公開(kāi)。

      這是徹底的閉源。

      從商業(yè)邏輯上不難理解。Meta今年AI基礎(chǔ)設(shè)施支出上限1350億美元,這個(gè)數(shù)字需要收入來(lái)支撐,單靠開(kāi)源的生態(tài)聲望顯然不夠用。當(dāng)競(jìng)爭(zhēng)對(duì)手的每一代模型都在拉開(kāi)能力差距時(shí),把最先進(jìn)的架構(gòu)創(chuàng)新保持私密,是避免自己的研發(fā)成果直接養(yǎng)肥對(duì)手的理性選擇。

      但從開(kāi)發(fā)者社區(qū)的視角,這是一次背叛。Llama之所以有價(jià)值,恰恰因?yàn)樗梢员幌螺d、被修改、被本地部署。Muse Spark做不到這些。開(kāi)發(fā)者失去的不只是一個(gè)可用的模型,而是一整套建立在Meta開(kāi)放性信譽(yù)上的工作流。

      汪韜在X上說(shuō)得很直白:“這是第一步,更大的模型已經(jīng)在開(kāi)發(fā)中?!毖韵轮猓琈use Spark只是Muse系列的起點(diǎn),后面的Muse才是真正的重頭戲。這個(gè)表述在技術(shù)上可能是真的,但對(duì)那些已經(jīng)依賴(lài)Llama生態(tài)的開(kāi)發(fā)者來(lái)說(shuō),這個(gè)“未來(lái)的承諾”能不能兌現(xiàn)不好說(shuō)。

      六、扎克伯格真正在下的那盤(pán)棋

      把Muse Spark放在產(chǎn)品層面看,它有點(diǎn)像今天的字節(jié)。

      個(gè)人超級(jí)智能,這是扎克伯格在Facebook帖子里用的詞。Muse Spark將直接驅(qū)動(dòng)Facebook、Instagram、WhatsApp、Messenger上的MetaAI助手,以及Ray-BanMetaAI眼鏡。超過(guò)35億人的觸點(diǎn),這是OpenAI和Anthropic沒(méi)有的分發(fā)優(yōu)勢(shì)。

      購(gòu)物模式最能說(shuō)明問(wèn)題。MetaAI識(shí)別用戶(hù)在Instagram上看到的穿搭或家具,結(jié)合用戶(hù)的興趣數(shù)據(jù)和行為信號(hào),直接推薦商品并完成購(gòu)買(mǎi)。這不只是個(gè)好用的功能,這是Meta的社交圖譜和用戶(hù)數(shù)據(jù),第一次被系統(tǒng)性地接入AI推理鏈條。

      健康場(chǎng)景的布局同樣值得注意。與1000名醫(yī)生合作定制訓(xùn)練數(shù)據(jù),這是Meta試圖在醫(yī)療健康信息領(lǐng)域占據(jù)位置的明確信號(hào)。這個(gè)場(chǎng)景的黏性高、用戶(hù)需求真實(shí),但同時(shí)也意味著隱私風(fēng)險(xiǎn)極高——用戶(hù)需要用Facebook或Instagram賬號(hào)登錄才能使用Muse Spark,而Meta的隱私政策對(duì)于如何使用這些健康查詢(xún)數(shù)據(jù),措辭相當(dāng)模糊。

      從競(jìng)爭(zhēng)格局來(lái)看,Muse Spark的發(fā)布時(shí)機(jī)很有意思。就在前一天,Anthropic剛剛公布了Claude Mythos,初始僅向少數(shù)企業(yè)客戶(hù)開(kāi)放,重點(diǎn)指向網(wǎng)絡(luò)安全防御。中國(guó)的Z.AI本周也在代碼基準(zhǔn)SWE-BenchPro上刷了新高。前沿AI的戰(zhàn)線越來(lái)越寬,入局的玩家越來(lái)越多。

      在這個(gè)背景下,Muse Spark想做的事,是把Meta重新釘回頂層牌桌——不一定是最強(qiáng),但得夠格參與對(duì)話(huà)。

      七、Llama4的幽靈還在

      最后還有一個(gè)問(wèn)題,沒(méi)有人能假裝忘掉Llama 4的基準(zhǔn)造假。

      那次事件之后,Meta對(duì)所有自己公布的測(cè)試數(shù)據(jù)都欠下了一筆信譽(yù)債。Muse Spark發(fā)布時(shí)附上了大量基準(zhǔn)數(shù)字,Artificial Analysis也拿到了早期測(cè)試資格并獨(dú)立評(píng)測(cè)。

      但這個(gè)問(wèn)題始終存在,你怎么知道這次是真實(shí)的?

      Muse Spark的Contemplating模式,是所有用戶(hù)都能用到的那個(gè),還是又是一個(gè)專(zhuān)為基準(zhǔn)測(cè)試微調(diào)的特供版本?

      Meta說(shuō)Contemplating模式會(huì)“逐步推出”,這個(gè)措辭留了太多解釋空間。

      結(jié)語(yǔ)

      Muse Spark是一張入場(chǎng)券,不是終點(diǎn)。

      它證明汪韜主導(dǎo)的九個(gè)月重建是有產(chǎn)出的,證明”思維壓縮”這個(gè)新技術(shù)能跑出比Llama4 Maverick高得多的效率,也證明Meta在多模態(tài)和健康領(lǐng)域找到了真實(shí)的差異化空間。

      但它同時(shí)也是一個(gè)信號(hào):Meta放棄了它在AI領(lǐng)域最獨(dú)特的定位。Llama時(shí)代,Meta是那個(gè)把尖端模型免費(fèi)開(kāi)放給所有人的硅谷巨頭,這件事讓它在開(kāi)發(fā)者心中的地位跟OpenAI和Anthropic完全不同?,F(xiàn)在這個(gè)定位沒(méi)了。

      接下來(lái)Muse系列會(huì)涌出更強(qiáng)大的模型。更大的基建,更多的工程師,更高的算力密度。扎克伯格說(shuō)得很清楚,這場(chǎng)賭局還在中場(chǎng)。

      但有一件事已經(jīng)確定:開(kāi)源的Meta,結(jié)束了。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      看到伴娘的第一眼就愛(ài)上了,這伴娘也太漂亮了吧

      看到伴娘的第一眼就愛(ài)上了,這伴娘也太漂亮了吧

      阿廢冷眼觀察所
      2026-04-11 17:32:43
      全皇馬都看清了!只有他還在裝睡,姆巴佩 + 維尼修斯徹底崩盤(pán)

      全皇馬都看清了!只有他還在裝睡,姆巴佩 + 維尼修斯徹底崩盤(pán)

      奶蓋熊本熊
      2026-04-12 04:45:31
      隨著申花1-0戰(zhàn)勝海港,泰山1-0,中超最新積分:榜首領(lǐng)先墊底20分

      隨著申花1-0戰(zhàn)勝海港,泰山1-0,中超最新積分:榜首領(lǐng)先墊底20分

      球場(chǎng)沒(méi)跑道
      2026-04-11 21:36:16
      看了一天!終于理清特朗普老婆和愛(ài)潑斯坦的瓜!

      看了一天!終于理清特朗普老婆和愛(ài)潑斯坦的瓜!

      啃金融
      2026-04-10 22:47:23
      CBA排名一夜大亂!廣州殺進(jìn)第12,又有黑馬搶前4,廣東這下更難了

      CBA排名一夜大亂!廣州殺進(jìn)第12,又有黑馬搶前4,廣東這下更難了

      后仰大風(fēng)車(chē)
      2026-04-11 22:55:36
      阿爾卡拉斯苦戰(zhàn)2小時(shí)逆轉(zhuǎn),決賽再碰辛納火藥味拉滿(mǎn)

      阿爾卡拉斯苦戰(zhàn)2小時(shí)逆轉(zhuǎn),決賽再碰辛納火藥味拉滿(mǎn)

      賽場(chǎng)速報(bào)局
      2026-04-12 02:42:41
      值了!中超5萬(wàn)歐新外援剛來(lái)5場(chǎng)造3球:未來(lái)國(guó)足真可以歸化

      值了!中超5萬(wàn)歐新外援剛來(lái)5場(chǎng)造3球:未來(lái)國(guó)足真可以歸化

      邱澤云
      2026-04-11 22:57:46
      過(guò)午不食?55歲男子堅(jiān)持2年不吃晚飯,去體檢后,他的胃怎樣了?

      過(guò)午不食?55歲男子堅(jiān)持2年不吃晚飯,去體檢后,他的胃怎樣了?

      白話(huà)電影院
      2026-04-09 14:36:58
      張雪夸同行豪爵踏板,豪爵老板回應(yīng):當(dāng)時(shí)我就震驚了!

      張雪夸同行豪爵踏板,豪爵老板回應(yīng):當(dāng)時(shí)我就震驚了!

      童叔不飆車(chē)
      2026-04-09 20:43:06
      腳痛醫(yī)頭?楊世元突然“腦震蕩”!前國(guó)腳質(zhì)疑,申花教練當(dāng)場(chǎng)申訴

      腳痛醫(yī)頭?楊世元突然“腦震蕩”!前國(guó)腳質(zhì)疑,申花教練當(dāng)場(chǎng)申訴

      足球大腕
      2026-04-12 00:34:50
      48歲拉爾薩魅力不減,17歲年齡差,讓NBA球星賭上人生與家庭

      48歲拉爾薩魅力不減,17歲年齡差,讓NBA球星賭上人生與家庭

      羅氏八卦
      2026-04-11 18:00:03
      菲律賓悔哭了!仁愛(ài)礁趴了25年的破船,竟是幫中國(guó)逆襲的神助攻

      菲律賓悔哭了!仁愛(ài)礁趴了25年的破船,竟是幫中國(guó)逆襲的神助攻

      晨初浮若
      2026-04-11 11:35:18
      周一見(jiàn)12年后,文章開(kāi)店客流爆滿(mǎn),馬伊琍蛻變,唯有姚笛復(fù)出艱難

      周一見(jiàn)12年后,文章開(kāi)店客流爆滿(mǎn),馬伊琍蛻變,唯有姚笛復(fù)出艱難

      萌神木木
      2026-04-11 20:56:36
      難怪那么多人買(mǎi)她直播間的東西,真人確實(shí)好看。

      難怪那么多人買(mǎi)她直播間的東西,真人確實(shí)好看。

      動(dòng)物奇奇怪怪
      2026-04-11 18:24:30
      為何?;鹬皇且晾氏掳雸?chǎng)苦難的開(kāi)端?

      為何?;鹬皇且晾氏掳雸?chǎng)苦難的開(kāi)端?

      高博新視野
      2026-04-11 08:00:18
      單親媽媽不停曬13歲女兒,希望能給孩子找個(gè)好的后爸

      單親媽媽不停曬13歲女兒,希望能給孩子找個(gè)好的后爸

      映射生活的身影
      2026-04-09 20:09:42
      伊媒:美方“漫天要價(jià)”阻礙談判 霍爾木茲海峽議題分歧嚴(yán)重

      伊媒:美方“漫天要價(jià)”阻礙談判 霍爾木茲海峽議題分歧嚴(yán)重

      環(huán)球網(wǎng)資訊
      2026-04-12 07:02:24
      這絕對(duì)是史上最不禮貌的鍵盤(pán)

      這絕對(duì)是史上最不禮貌的鍵盤(pán)

      放毒
      2026-04-11 10:53:19
      樊振東放棄世乒賽引爭(zhēng)議!國(guó)際乒聯(lián)主席回應(yīng):打完聯(lián)賽依舊可回歸

      樊振東放棄世乒賽引爭(zhēng)議!國(guó)際乒聯(lián)主席回應(yīng):打完聯(lián)賽依舊可回歸

      潮鹿逐夢(mèng)
      2026-04-11 13:08:56
      F1緊急調(diào)整2026賽車(chē)混動(dòng)規(guī)則,解決最高70公里時(shí)速差問(wèn)題

      F1緊急調(diào)整2026賽車(chē)混動(dòng)規(guī)則,解決最高70公里時(shí)速差問(wèn)題

      IT之家
      2026-04-11 10:13:06
      2026-04-12 08:51:00
      鈦媒體APP incentive-icons
      鈦媒體APP
      獨(dú)立財(cái)經(jīng)科技媒體
      132104文章數(shù) 862090關(guān)注度
      往期回顧 全部

      科技要聞

      半夜被燃燒瓶砸醒,OpenAI CEO發(fā)文反思

      頭條要聞

      男子自帶茅臺(tái)就餐飲用時(shí)感覺(jué)不對(duì)味 服務(wù)員還"消失"了

      頭條要聞

      男子自帶茅臺(tái)就餐飲用時(shí)感覺(jué)不對(duì)味 服務(wù)員還"消失"了

      體育要聞

      換帥之后,他們從降級(jí)區(qū)沖到升級(jí)區(qū)

      娛樂(lè)要聞

      鄭鈞回應(yīng)兒子走路:會(huì)監(jiān)督他挺直腰板

      財(cái)經(jīng)要聞

      從日本翻身看:這次誰(shuí)能扛住高油價(jià)?

      汽車(chē)要聞

      煥新極氪007/007GT上市 限時(shí)19.39萬(wàn)起

      態(tài)度原創(chuàng)

      家居
      教育
      親子
      房產(chǎn)
      公開(kāi)課

      家居要聞

      復(fù)古風(fēng)格 自然簡(jiǎn)約

      教育要聞

      “父親的心已經(jīng)死了”,10后女孩報(bào)到職高,父親全程背對(duì)引人心疼

      親子要聞

      人為什么會(huì)沒(méi)有3歲前的記憶呢?

      房產(chǎn)要聞

      土地供應(yīng)突然暴跌!2026海口樓市,格局大變!

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版