【億邦原創】4月16日,阿里巴巴和騰訊分別發布了各自的世界模型產品。阿里ATH事業群推出的是開放式世界模型“Happy Oyster”,騰訊混元團隊發布了3D世界模型“HY-World 2.0”。
Happy Oyster側重交互式內容創作平臺,用戶可以在生成過程中持續輸入指令,畫面實時響應,瞄準影視制作、游戲開發等創意產業的效率提升。
HY-World 2.0更像3D資產工廠,生成的不是視頻,而是可編輯、可導入游戲引擎的真實3D資產,直接服務于游戲開發和具身智能仿真訓練。
一個走閉源產品路線,一個走開源生態路線。雖然方向不同,但都是想讓AI更好地理解和生成物理世界,至于哪條路更走得通,還得開發者來投票。
1、“Happy”宇宙再下一城
4月16日,阿里巴巴ATH事業群正式推出開放式世界模型產品“Happy Oyster”(快樂牡蠣),主打實時世界創建與交互。這是繼視頻生成模型HappyHorse(快樂馬)之后,ATH推出的第二款產品,從“生成視頻”進一步延伸至“交互式世界模型”。
與Sora、Gen-3等傳統AI視頻工具“寫prompt→等渲染→收到成片”的一次性線性流程不同,Happy Oyster在生成過程中可持續接收用戶指令,畫面實時響應、持續演繹。這讓使Happy Oyster更接近一個實時渲染引擎,而不僅僅是后期剪輯師。
產品提供兩種深度交互模式:導演模式支持最長3分鐘、最高720p的視頻生成,創作者可在生成過程中隨時切換機位、指揮角色行動,甚至改變劇情走向;漫游模式支持1分鐘的實時生成,允許用戶以第一人稱視角在生成的3D環境中自由移動,支持鍵盤控制與攝像頭實時驅動,實現“所言即所見,所行即所得”。
Happy Oyster基于原生多模態架構,底層是一個支持音視頻聯合生成的流式生成世界模型,依托阿里強大的多模態訓練,Happy Oyster對物理規律(如重力、碰撞、光影變化)有更深層的模擬,生成的3D動態環境在視角轉換時能保持極高的穩定性。
2、騰訊混元開源3D世界模型
同一天,騰訊混元團隊正式發布并開源混元3D世界模型2.0(HY-World 2.0),支持文字、圖片、視頻等多種模態輸入,能夠自動生成、重建和模擬包含人、物、景的完整3D世界,并支持多格式3D資產(Mesh/3DGS/點云等)導出,可與Unity、UE等主流游戲引擎工作流無縫對接。
HY-World 2.0的核心升級,是把能力從“生成單個物體”擴展到了“生成完整世界”,可以直接生成可二次編輯的3D資產文件,并導入到游戲制作或具身仿真引擎,降低了游戲地圖的創作門檻。官方稱,在開源方案中,HY-World 2.0是首個達到SOTA水平的3D世界模型。
HY-World 2.0延續了騰訊混元的一貫策略,發布即開源。模型權重和代碼已在GitHub與Hugging Face同步開源。
2026年以來,阿里ATH事業群已連續推出視頻生成模型HappyHorse、AI開發工具Meoo、開放世界模型Happy Oyster等多款產品,節奏密集;騰訊混元也在3D世界模型賽道上持續深耕,從1.0到2.0迭代迅速。
兩家幾乎同時出手,既標志著世界模型賽道從概念驗證進入產品落地階段,也意味著大模型競爭的焦點正在從語言模型、視頻生成,向更復雜的物理世界建模和實時交互方向延伸。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.