<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      扎克伯格重開一局

      0
      分享至



      這是過去一年里Meta最需要一個好消息的時刻。Llama4的基準造假丑聞讓開發者社區徹底寒了心,旗艦項目Behemoth遲遲沒有下文,與此同時OpenAI、Anthropic和Google的軍備競賽越打越猛。

      扎克伯格今天把Muse Spark推到了臺前。

      這是Meta超級智能實驗室(MSL)交出的第一份答卷,也是汪韜(AlexandrWang)加入Meta九個月后,第一次向外界證明這筆143億美元的賭注沒有白下。發布當日,Meta股價盤中最高漲超10%,收漲約9%,市場給出了它想看到的那個答案。

      一、九個月,從廢墟里蓋起來

      要理解MuseSpark,先得理解它是怎么來的。

      去年夏天,Llama4的基準測試被抓了現行:Meta承認拿了針對特定任務微調的專用版本去刷分,普通用戶能用到的那個,跟公布的數據壓根對不上。這件事對MetaAI的品牌傷害不小,但更深的問題在于,就算沒有造假,Llama4也沒能在前沿模型序列里站穩腳跟。

      扎克伯格再次推倒重來。

      他找來了時年29歲的ScaleAI聯合創始人汪韜,花143億美元買下ScaleAI49%的非投票股權,把汪韜塞進Meta首席AI官的位置,同時成立Meta超級智能實驗室,從OpenAI、Anthropic、Google高薪挖人,據報道部分研究員的薪酬包含股權在內達到數億美元。

      然后是整整九個月的沉默。

      汪韜在X上寫道:“九個月前,我們從零開始重建了AI技術棧。新的基礎設施、新的架構、新的數據流水線。”不是在原有基礎上打補丁,是字面意義上的重頭來過。



      結果就是MuseSpark。內部代號Avocado,是Meta新Muse系列的首個型號,定位輕量、快速,但具備完整的推理能力。

      二、“思維壓縮”:效率才是真正的護城河

      Muse Spark最讓人意外的數字,不是某個基準測試的排名,而是計算效率。

      Meta聲稱,Muse Spark達到Llama4Maverick同等性能水平所需的計算量,減少了十倍以上。背后是一種叫做“思維壓縮(ThoughtCompression)”的訓練技術:在強化學習階段,對模型過度思考的行為施加懲罰,迫使它用更少的推理token解決同樣的問題,同時不犧牲準確率。



      這件事的戰略意義比表面看起來大得多。

      AI軍備競賽進入2026年,算力成本依然是最核心的約束之一。Meta今年的AI基礎設施支出上限調至1350億美元,比上年幾乎翻倍。但光砸錢不夠,燒得更高效才是差異點。如果十分之一的計算量能跑出同等智力水平,那意味著同樣的預算可以跑更多次實驗、迭代更多代模型。

      從這個角度看,“思維壓縮”不只是一個技術細節,它意味著這套新架構是可以規模化的。

      三、偏科的“視覺天才”

      評估一個新模型,先看它的長板和短板分別在哪里。Muse Spark的性格相當鮮明。

      長板:多模態與健康

      第三方機構ArtificialAnalysis的獨立評測,給Muse Spark打出了52分(滿分參照系中),在IntelligenceIndexv4.0排名第四,位列Gemini3.1Pro(57)、GPT-5.4(57)和ClaudeOpus4.6(53)之后。

      但在具體科目上,Muse Spark的多模態能力是真實的強項。視覺理解(MMMU-Pro)排名第二,得80.5,僅次于Gemini3.1Pro的82.4。圖表推理(CharXivReasoning)得86.4,力壓Gemini的80.2和GPT-5.4的82.8,全場第一。

      HealthBenchHard上,Muse Spark拿了42.8,超過GPT-5.4的40.1,把Gemini3.1Pro的20.6甩開一大截。Meta號稱與超過1000名醫生合作,專門為健康場景定制了訓練數據。



      短板:邏輯推理與代碼

      然后是短板,同樣明顯。

      ARCAGI2(抽象推理):Muse Spark得42.5,而Gemini3.1Pro得76.5,GPT-5.4得76.1。差距將近一倍,這個分布不像是追分的問題,更像是架構層面的結構性缺口。

      終端編程(Terminal-Bench2.0):Muse Spark得59.0,GPT-5.4是75.1,Gemini是68.5。Meta自己的技術博客里也直接承認,“長程agentic系統和代碼工作流”是當前的重點投入方向。

      三級推理模式

      模型提供三種模式:Instant(即時)、Thinking(思考)、Contemplating(沉思)。Contemplating模式最有意思——它并行啟動多個子智能體,分頭處理任務再綜合結論。Meta宣稱在這個模式下,HLE(人類最后考試)得分達到58%,FrontierScienceResearch達到38%,能跟GeminiDeepThink和GPTPro在同一個場上競爭。



      值得一提的是,Muse Spark的token效率也很出色。在IntelligenceIndex測評中使用了約5800萬輸出token,與Gemini3.1Pro相當,遠低于ClaudeOpus4.6的1.57億。

      四、深水炸彈:這對DeepSeek意味著什么?

      Muse Spark 走向閉源,不僅是 Meta 的轉型,更是全球 AI 生態的一次大洗牌。首當其沖的,就是一直以“開源高效率”著稱的 DeepSeek。

      DeepSeek 此前憑借極致的算力利用率在開源界封神,但 Muse Spark 提出的“思維壓縮”直接在閉源側把效率拉到了新高度。如果閉源模型不僅智力更強,連推理成本都下探到開源模型的水平,DeepSeek 這種“平替”的性價比優勢將被大幅削弱。

      當然,Meta 撤出開源,意味著開源界失去了一根定海神針。這給 DeepSeek 留下了巨大的市場空間去接管那些“被背叛”的開發者,但同時也讓 DeepSeek 陷入了孤軍奮戰。沒有了 Llama 作為行業標準,DeepSeek 必須獨自面對閉源巨頭們更厚的技術壁壘。

      不過,汪韜主導的這次重建,在多模態融合和推理效率上的思路,與 DeepSeek 追求的方向高度重合。這意味著接下來的競賽將不再是“開源 vs 閉源”的意識形態之爭,而是純粹的、關于“誰能用更少的卡跑出更強的智力”的終極對決。

      五、最大的新聞:開源時代結束了

      從2023年開始,Llama系列是硅谷“開源AI”的精神圖騰。開發者靠Llama做了無數應用,學術界用它做研究,初創公司用它起家,甚至競爭對手也拿它作為參照系。Meta在這件事上賺到的品牌資產,是其AI業務最重要的護城河之一。

      Muse Spark放棄了這個護城河。

      官方說法很溫和:“我們希望未來版本能夠開源。”但沒有時間表,沒有承諾,沒有框架。當下這個版本,只能通過MetaAI應用、meta.ai網站使用,部分合作伙伴可以申請API私測資格。架構和權重不公開。

      這是徹底的閉源。

      從商業邏輯上不難理解。Meta今年AI基礎設施支出上限1350億美元,這個數字需要收入來支撐,單靠開源的生態聲望顯然不夠用。當競爭對手的每一代模型都在拉開能力差距時,把最先進的架構創新保持私密,是避免自己的研發成果直接養肥對手的理性選擇。

      但從開發者社區的視角,這是一次背叛。Llama之所以有價值,恰恰因為它可以被下載、被修改、被本地部署。Muse Spark做不到這些。開發者失去的不只是一個可用的模型,而是一整套建立在Meta開放性信譽上的工作流。

      汪韜在X上說得很直白:“這是第一步,更大的模型已經在開發中。”言下之意,Muse Spark只是Muse系列的起點,后面的Muse才是真正的重頭戲。這個表述在技術上可能是真的,但對那些已經依賴Llama生態的開發者來說,這個“未來的承諾”能不能兌現不好說。

      六、扎克伯格真正在下的那盤棋

      把Muse Spark放在產品層面看,它有點像今天的字節。

      個人超級智能,這是扎克伯格在Facebook帖子里用的詞。Muse Spark將直接驅動Facebook、Instagram、WhatsApp、Messenger上的MetaAI助手,以及Ray-BanMetaAI眼鏡。超過35億人的觸點,這是OpenAI和Anthropic沒有的分發優勢。

      購物模式最能說明問題。MetaAI識別用戶在Instagram上看到的穿搭或家具,結合用戶的興趣數據和行為信號,直接推薦商品并完成購買。這不只是個好用的功能,這是Meta的社交圖譜和用戶數據,第一次被系統性地接入AI推理鏈條。

      健康場景的布局同樣值得注意。與1000名醫生合作定制訓練數據,這是Meta試圖在醫療健康信息領域占據位置的明確信號。這個場景的黏性高、用戶需求真實,但同時也意味著隱私風險極高——用戶需要用Facebook或Instagram賬號登錄才能使用Muse Spark,而Meta的隱私政策對于如何使用這些健康查詢數據,措辭相當模糊。

      從競爭格局來看,Muse Spark的發布時機很有意思。就在前一天,Anthropic剛剛公布了ClaudeMythos,初始僅向少數企業客戶開放,重點指向網絡安全防御。中國的Z.AI本周也在代碼基準SWE-BenchPro上刷了新高。前沿AI的戰線越來越寬,入局的玩家越來越多。

      在這個背景下,Muse Spark想做的事,是把Meta重新釘回頂層牌桌——不一定是最強,但得夠格參與對話。

      七、Llama4的幽靈還在

      最后還有一個問題,沒有人能假裝忘掉Llama4的基準造假。

      那次事件之后,Meta對所有自己公布的測試數據都欠下了一筆信譽債。Muse Spark發布時附上了大量基準數字,ArtificialAnalysis也拿到了早期測試資格并獨立評測。

      但這個問題始終存在,你怎么知道這次是真實的?

      Muse Spark的Contemplating模式,是所有用戶都能用到的那個,還是又是一個專為基準測試微調的特供版本?

      Meta說Contemplating模式會“逐步推出”,這個措辭留了太多解釋空間。

      結語

      Muse Spark是一張入場券,不是終點。

      它證明汪韜主導的九個月重建是有產出的,證明”思維壓縮”這個新技術能跑出比Llama4Maverick高得多的效率,也證明Meta在多模態和健康領域找到了真實的差異化空間。

      但它同時也是一個信號:Meta放棄了它在AI領域最獨特的定位。Llama時代,Meta是那個把尖端模型免費開放給所有人的硅谷巨頭,這件事讓它在開發者心中的地位跟OpenAI和Anthropic完全不同。現在這個定位沒了。

      接下來Muse系列會涌出更強大的模型。更大的基建,更多的工程師,更高的算力密度。扎克伯格說得很清楚,這場賭局還在中場。

      但有一件事已經確定:開源的Meta,結束了。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      這幾天,有不少阿里員工家屬曬自己老公“升職加薪”

      這幾天,有不少阿里員工家屬曬自己老公“升職加薪”

      螞蟻大喇叭
      2026-04-24 15:26:53
      愛吃豬腳飯的注意了!深圳43歲男子被緊急送醫搶救!醫生:再晚來一步命就沒了

      愛吃豬腳飯的注意了!深圳43歲男子被緊急送醫搶救!醫生:再晚來一步命就沒了

      深圳晚報
      2026-04-27 10:23:06
      槍響白宮晚宴,戳破美“民主”假面

      槍響白宮晚宴,戳破美“民主”假面

      烽火瞭望者
      2026-04-27 06:11:48
      拼命演戲還清一億四千萬巨債,豪門夢醒,現回浙江農家過踏實日子

      拼命演戲還清一億四千萬巨債,豪門夢醒,現回浙江農家過踏實日子

      觀察者海風
      2026-04-04 12:59:45
      注意!中老年男性有性生活和沒性生活,差別居然這么大?

      注意!中老年男性有性生活和沒性生活,差別居然這么大?

      皓皓情感說
      2026-04-22 08:20:32
      未婚生女,孩子生母嫁別人,如今他住進北京別墅,和女兒相依為命

      未婚生女,孩子生母嫁別人,如今他住進北京別墅,和女兒相依為命

      北緯的咖啡豆
      2026-04-27 17:07:58
      胖東來、盒馬、山姆“最暢銷”的白酒是什么樣子?

      胖東來、盒馬、山姆“最暢銷”的白酒是什么樣子?

      酒說
      2026-04-26 13:37:06
      中國會不會出現第二個毛澤東?答案一不會,但會出現新的杰出領袖

      中國會不會出現第二個毛澤東?答案一不會,但會出現新的杰出領袖

      南宗歷史
      2026-04-27 23:20:25
      美國叫囂,4年內不依賴中國稀土,話音未落,我國對美稀土加價44%

      美國叫囂,4年內不依賴中國稀土,話音未落,我國對美稀土加價44%

      書紀文譚
      2026-04-27 19:16:28
      八路軍最慘烈一仗:5萬人近全軍覆沒,指揮官是名將鄧華、宋時輪

      八路軍最慘烈一仗:5萬人近全軍覆沒,指揮官是名將鄧華、宋時輪

      云霄紀史觀
      2026-04-26 20:00:52
      假若沒有這場婚外情,我國可能增加7600個島嶼、29萬平方公里領土

      假若沒有這場婚外情,我國可能增加7600個島嶼、29萬平方公里領土

      抽象派大師
      2026-04-26 18:18:39
      日專家曾指出:中日一旦開戰,以日本自衛隊實力,中日難分勝負?

      日專家曾指出:中日一旦開戰,以日本自衛隊實力,中日難分勝負?

      混沌錄
      2026-04-27 19:31:17
      劉濤近況曝光!逛武漢商場,47歲又白又美,還清債務后越活越瀟灑

      劉濤近況曝光!逛武漢商場,47歲又白又美,還清債務后越活越瀟灑

      庭小娛
      2026-04-27 10:46:21
      阿里納斯:詹姆斯退役后、媒體再無流量!選他而不是喬丹來建隊!

      阿里納斯:詹姆斯退役后、媒體再無流量!選他而不是喬丹來建隊!

      歷史第一人梅西
      2026-04-27 10:59:36
      剛從新疆回來!滿滿的血淚教訓,希望可以讓你避免踩坑!

      剛從新疆回來!滿滿的血淚教訓,希望可以讓你避免踩坑!

      娛樂的硬糖吖
      2026-04-27 13:14:28
      關曉彤最新官宣,已與鹿晗無關

      關曉彤最新官宣,已與鹿晗無關

      泠泠說史
      2026-04-25 20:47:20
      越到后期越不好惹的三個星座

      越到后期越不好惹的三個星座

      星座不求人
      2026-04-27 20:21:20
      國內多地開啟五一超長假,中小學“春假+五一”最高可連休11天,新疆5月可休15天,最早放假的游客已在路上

      國內多地開啟五一超長假,中小學“春假+五一”最高可連休11天,新疆5月可休15天,最早放假的游客已在路上

      極目新聞
      2026-04-26 22:51:26
      大量硼砂,別再給家里人吃了!這10類食物最易摻硼砂,超危險

      大量硼砂,別再給家里人吃了!這10類食物最易摻硼砂,超危險

      笑熬漿糊111
      2026-04-13 00:05:12
      張天愛太豐滿了,真空穿掛脖裙都兜不住好身材,我感慨資本會選人

      張天愛太豐滿了,真空穿掛脖裙都兜不住好身材,我感慨資本會選人

      動物奇奇怪怪
      2026-04-27 13:11:08
      2026-04-28 00:03:00
      強調Next incentive-icons
      強調Next
      關注科技,與創新企業共成長
      68文章數 3關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4上線三天,第一批實測出來了

      頭條要聞

      坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

      頭條要聞

      坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

      體育要聞

      人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

      娛樂要聞

      黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

      財經要聞

      Meta 140億收購Manus遭中國發改委否決

      汽車要聞

      不那么小眾也可以 smart的路會越走越寬

      態度原創

      手機
      家居
      游戲
      數碼
      公開課

      手機要聞

      輕薄本迎來驍龍時刻!華碩推出三款萬元AI PC,太精準了

      家居要聞

      江景風格 流動的秩序

      LPL又一超級強隊誕生!S賽冠軍復出豪取六連勝,小局12-0一場不敗

      數碼要聞

      LABUBU冰箱還未正式發售就已溢價3000元

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 老司机久久精品| 国产精品18久久久久久vr| 一本色道久久综合| 中文字幕精品无码亚| 2022亚洲男人天堂| 亚洲AV中文无码乱人伦在线视色| 国产极品美女高潮抽搐免费网站| 熟女视频在线观看| 亚洲欧洲精品日韩av| 亚洲AV成人无码久久精品四虎| 日韩色区| 丰满人妻被中出中文字幕| 亚洲综合黄色| 欧美牲交videossexeso欧美 | 国产一区二区亚洲一区二区三区| 免费播放岛国影片av| 中文字幕三四区男人| 天堂中文8资源在线8| 国精产品乱码一区一区三区四区| 瑞丽市| 日本阿v精品视频在线观看| 久久国产精品久久精品国产| 野花香电视剧免费观看全集高清播放| 国产精品一二| 国产亚洲精品第一综合| 亚洲v欧美v日韩v国产v| 99视频精品全部免费 在线| 日本色导航| 久久精品免视看国产成人| 伊人桃花网| 最近免费中文字幕大全免费版视频| 日本在线a一区视频高清视频| 亚洲无码制服丝袜视频| 一本大道AV人久久综合| 亚洲一区二区三区av在线观看| 亚洲老熟女一区二区三区| 亚洲乱码日产精品bd在线看| 岛国无码av| 免费看美女被靠到爽的视频| 91精品网| 岛国片人妻三上悠亚|