文 | 新質動能,作者|沛林,編輯|沐風
Llama 4真的作弊刷榜了!
Meta前首席科學家楊立昆(Yann LeCun)近日在采訪中證實,團隊為優化基準測試結果,對不同評測使用了不同版本的模型,“結果的確被篡改了一點”。
另一位被裁的FAIR原技術總監田淵棟,則直指Llama 4的研發是“外行領導內行”。
從Llama 3的“開源盟主”到Llama 4的口碑崩塌,不過一年時間。這背后,是Meta內部管理的混亂與技術路線的搖擺。
隨著丑聞曝光與核心團隊出走,扎克伯格正推動一場劇烈的轉向:高薪挖人、換帥,并徹底放棄開源路線,轉而打造閉源模型“Avocado”。
然而,這款被寄予厚望的新作,卻深陷“借鑒”爭議——它被曝使用通義千問優化,并試圖融合谷歌、OpenAI等多方技術。
曾經的開源引領者,如今變為閉源的“集大成者”。
2026年,Meta的AI命運,幾乎全部壓在了這個拼湊而成的Avocado上。如果它再失敗,Meta可能將在大模型的核心賽道上徹底掉隊。
Llama 4 作弊了!
作為圖靈獎得主?、“卷積神經網絡之父”與“深度學習三巨頭”之一,楊立昆于2013年受邀加入Meta擔任首席科學家,并成立了大名鼎鼎的人工智能研究院(FAIR)。多年來,楊立昆一直是Meta前沿研究的技術引領者與精神領袖。
當年扎克伯格為了請他出山,甚至不惜答應他不用搬去加州、不辭去教職且研究成果必須公開三項條件。
楊立昆已于2025年年底離職。雙方的分道揚鑣,本質是因為對技術路線無法達成一致:楊立昆瞧不上大語言模型路線,信奉世界模型,但扎克伯格卻一心撲在大語言模型上。
在近期的采訪中,楊立昆直言不諱地指出,外界關于Llama 4“刷榜作弊”的指控并非空穴來風。為了在基準測試中維持體面的排名,Meta的團隊確實在測試結果上“美化”了不少。他提到,團隊在不同的測試中甚至動用了不同的優化模型來專門刷分。
楊立昆痛批Meta內部對LLM上癮過甚,尤其是那些新挖來的超級智能實驗室成員。
他點名批評亞歷山大王:年輕且缺乏經驗。
雖然學得快,但壓根不懂研究,不知道怎么做、也不懂如何和研究員們共處。
在他眼中,這個28歲的年輕人,就是個young boy。
如果楊立昆離開是因為不認同大語言模型路線,那FAIR前研究科學家技術總監田淵棟連同其團隊整體被裁掉,就顯得更加戲劇性。
剛剛被裁掉時,田淵棟在社交媒體上無奈的表示:當初是被拉來給Llama4救火,結果項目真正的負責人沒有被問責,我們團隊卻被解雇了。
1月4日,田淵棟在社交媒體上對自己離開Meta這件事進一步做出說明:
“其實我也想過在公司十年多了,總有一天要離開,總不見得老死在公司里吧。”
甚至表示很長一段時間里心里都是希望“公司快把我開了吧”。
網友直呼,高級打工人吐槽起上班來,也沒什么分別。
而對于Llama 4 的失敗,田淵棟在后來的采訪中透露的內容,卻顯示出Meta內部更大的問題。而這些問題,早在Llama 3受到追捧的時期,就已經埋下種子。
從封神到幻滅
回顧Llama系列的迭代史,也曾有過輝煌。Llama 2和Llama 3曾是Meta最值得驕傲的底牌。
2023年和2024年的Meta,憑借“免費又好用”的開源策略,在AI界成為受尊重的公司。
Llama 2證明了開源模型可以與閉源巨頭叫板,而Llama 3則將這種性能推到了巔峰,在多項指標上甚至能與GPT-4打得有來有回,成為眾多創業者借鑒、使用的開源大模型。
那時的Meta工程師們外出參加會議,脊梁骨都是硬的,他們自豪于自己在做一個有意義的、能改變行業格局的項目。
然而,到了Llama 4,故事急轉直下,全面潰敗。造成這一結局的核心原因,在于Meta高層對技術演進方向的戰略誤判。
根據Meta前技術員工爆料,從Llama 3末期開始,扎克伯格和Meta高層開始過度強調“技術產品化”,他們急于將AI整合進WhatsApp、Instagram和Facebook的每一個角落。
在這種“產品優先”的激進指令下,Llama4的研發工作由更擅長產品與工程的高層領導,團隊將大量資源傾斜到了多模態和應用層面的適配,卻嚴重忽視了AI最重要的底層能力——推理。
田淵棟對此直接吐槽為“讓外行領導內行”。
就在Meta埋頭卷規模、卷應用的時候,外部世界發生了翻天覆地的變化。
OpenAI推出了基于思維鏈的o1模型,徹底改變了推理游戲的規則;緊接著,來自中國的DeepSeek以震撼的MOE混合專家架構橫空出世,不僅推理能力強悍,更以極低的成本撕碎了硅谷大廠引以為傲的成本壁壘。
管理層對底層技術理解的匱乏,直接導致了戰略路線上極其離譜的“燈下黑”。其實早在ChatGPTo1發布前,田淵棟的FAIR團隊就在研究思維鏈。
然而,因為此前FAIR與產品組之間沒有良性互動,且高層癡迷于“技術產品化”,這些自研成果被徹底埋沒。
DeepSeek的突襲讓Meta內部徹底亂了陣腳,扎克伯格在全員大會上雖然表面淡定,背地里卻開始下達“死命令”,要求不計代價追趕。并請來田淵棟帶領的FAIR團隊來“救火”。
田淵棟收到這一請求時,距離Llama 4定下的發布時間只剩2個月。明眼人都看得出來,這就是個燙手山芋,此時接手,只能盡力,很難善了。
在猶豫是否接手這一項目時,田淵棟還畫了一個表格。
![]()
表格
田淵棟后來自嘲道:曾以為這件事最多就這四種結果,沒想到最終扎克伯格給了他“被裁掉”這“第五種可能”,這讓他“對這社會的復雜性有了更為深刻的認識”。
產品定于2個月后上線,這條死線直接導致了Llama 4研發流程的畸形,田淵棟的團隊被迫在死線的倒逼下強行推進工作,結果的不盡如人意是可以預見的,最終只能依靠“刷榜”來維持脆弱的體面。
Llama4推出后,社區開發者很快在使用過程中發現問題,紛紛懷疑Meta宣稱的性能靠“刷榜”取得。
Meta當時否認了這一質疑。但是Llama 4的表現讓扎克伯格非常不滿。很快,FAIR團隊被裁,楊立昆出走。
扎克伯格親手拆解了自己耗時十年建立的科研體系。
Meta孤注一擲
裁撤舊體系的同時,扎克伯格在重金請“外來和尚”。
2025年7月中旬,扎克伯格以約4年3億美元的薪酬包與無限量GPU算力支持等頂級資源保證,挖來OpenAI研究員Jason Wei與Hyung Won Chung。其中,Jason Wei被認為是“思維鏈”開山論文的第一作者。
在管理層面,扎克伯格以143億美元的驚人價格收購Scale AI49%的股權(無投票權),并扶持該公司創始人、28歲的Alexandr Wang成為Meta首席人工智能官,直接向扎克伯格匯報。
這位年輕的新帥成立TBD實驗室,直接領導FAIR、產品與應用研究部與基礎設施部。
Meta陷入一種“自家珍寶當草芥,重金求援買后悔藥”的荒誕循環:一邊裁掉自研尖兵,一邊又急火攻心地花重金各種收購、招聘。
而在公司整體戰略上,Meta正在經歷一場極其痛苦且充滿爭議的“急轉彎”。
隨著Llama 4的潰敗,扎克伯格已基本宣告放棄了長期堅持的開源戰略,轉向重新開發名為“Avocado”的閉源模型。
這款被寄予厚望的求生之作,放棄了純粹的自研路徑,轉而試圖融合谷歌Gemma、OpenAI的技術亮點,甚至被曝出正在使用阿里巴巴的通義千問(Qwen)來優化其模型。
這種“集百家之長”的策略背后,更像是Meta對此前All in元宇宙,數百億美元投入卻換不回商業利潤的應激式焦慮。
現在的Meta,正處于從“理想主義開源先鋒”向“務實閉源追隨者”轉型的陣痛期。它在行業中的位置已從引領者滑落為焦慮的追趕者,試圖通過削減元宇宙預算、重組TBD實驗室來孤注一擲。
Meta現狀,已不再僅僅局限于一個Llama 4模型的得失,而是公司在AI這條路上調整方向后,是否真的能做成。
2026年春季Avocado的發布將是決定扎克伯格成敗的關鍵注腳。如果這款“博采眾長”的閉源模型無法實現性能突破,Meta不僅會丟失其曾引以為傲的開源生態,更可能在超級智能的競賽中徹底掉隊。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.