社交媒體巨頭Meta傳出在AI競爭中發力的最新消息,反映其在戰略重心從開源模式轉向追求前沿盈利模型的轉變。
美東時間18日周四媒體報道,Meta的首席AI官Alexandr Wang在上周四的內部問答會上披露,Meta正在開發代號為Mango的新一代圖像和視頻AI模型,以及代號為Avocado的下一代大語言模型(LLM),預計將于2026年上半年發布。
Wang表示,Avocado模型的重點之一是提升編程能力,同時公司正處于研究開發世界模型的早期階段。世界模型是一種通過吸收視覺信息來學習環境的AI技術。
這一消息進一步印證了Meta在AI領域的戰略調整。上周華爾街見聞就提到,有報道稱,Meta正在開發新的前沿AI模型Avocado,訓練模型時采用了使用了阿里巴巴的通義千問(QWEN)等第三方模型進行優化,且可能采用專有而非開源模式。這與Meta此前主推的開源Llama系列形成鮮明對比。
為推動AI研發,Meta在今年夏天重組了AI團隊,聘請Alexandr Wang領導新成立的超級智能部門Superintelligence Labs。CEO扎克伯格還親自從OpenAI挖走了20多名研究人員,組建了一支超過50人的AI專家團隊。
雙模型布局:圖像生成與語言能力并進
據本周四的報道,Meta正在同步推進兩個核心AI模型的開發。圖像和視頻模型Mango旨在增強Meta在生成式AI領域的競爭力,而文本模型Avocado則專注于提升編程等關鍵能力。
圖像生成已成為大型AI公司競爭的關鍵戰場。
谷歌今年8月末推出了基于Gemini 2.5 Flash模型的AI圖像生成及編輯工具——Nano Banana,推動Gemini月活躍用戶從7月的4.5億增至10月底的超6.5億。
Meta9月25日推出了與Midjourney合作開發的AI視頻生成器Vibes,不到一周,OpenAI就發布了自己的視頻生成應用Sora。
OpenAI CEO Sam Altman在上周與記者會面時強調了AI圖像生成對消費者的重要性,稱這是許多用戶的主要興趣點,也是讓他們持續回訪的"粘性"功能。
戰略轉向:從開源到專有模式
據上周的報道,Meta的AI戰略正在發生重大轉變。公司內部許多人原本預計Avocado模型會在今年年底前發布,但計劃已推遲至2026年第一季度。
報道稱,Avocado可能采用專有模式,這意味著外部開發者無法自由下載其權重和相關軟件組件。此舉若最終實施,將標志著該公司長期以來堅持的開源戰略發生顯著轉變,其做法將更接近谷歌與OpenAI等主要競爭對手的模式。
報道稱,這一轉變的催化劑之一是Llama 4在4月發布后未能贏得開發者青睞。此外,中國AI新星DeepSeek發布的R1模型采用了Llama架構的部分內容,這讓Meta部分員工感到不滿,進一步凸顯了開源策略的風險。
扎克伯格去年曾預測Llama系列將成為"業內最先進"的模型,并在今年1月的財報電話會議上專門討論了Llama。但在10月的最新財報會議上,他僅提及該品牌一次。
Meta今年6月豪擲143億美元投資Scale AI,挖來了這家獨角獸的創始人汪韜(Alexandr Wang),并在10月末公布三季報時將今年的公司資本支出指引上調至700億至720億美元。
世界模型:AI理解物理世界的新前沿
澎湃新聞此前介紹,世界模型的靈感源于人類的世界心智模型,人類通過感官獲取的抽象信息在大腦中被轉化為對周圍世界的具象理解,基于這些模型,大腦對世界進行預測,從而影響感知和行動。
英偉達指出,世界模型是用于理解現實世界動態的神經網絡,包括物理屬性和空間屬性。它們可以使用文本、圖像、視頻和運動等輸入數據來生成模擬實際物理環境的視頻,能夠為人工智能提供理解真實三維物理世界的能力,對具身智能的實現具有重大意義。
不過,世界模型面臨顯著的技術挑戰。與目前用于生成式模型的計算量相比,訓練和運行世界模型需要龐大的算力。世界模型也存在幻覺問題,并會內化訓練數據中的偏見。如果這些障礙被克服,世界模型可以為機器人技術和AI決策帶來突破,使AI能夠對所處情境形成理解并推理出可能的解決方案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.