想象一下,你只需要一張圖片,甚至只是一句簡單的文字描述,AI就能為你構(gòu)建一個可以無限探索的3D世界。
這個世界不是一張靜態(tài)的效果圖,也不是一段固定的動畫,而是一個你可以隨時進入、保存進度、甚至分享給朋友的永久空間。

這正是WorldLabs公司發(fā)布的模型Marble所要實現(xiàn)的目標。當外界還在討論谷歌Genie這類模型時,李飛飛特別指出了他們的核心差異:永久持續(xù)性。
這標志著生成式AI正在經(jīng)歷一場深刻的范式轉(zhuǎn)移,從創(chuàng)造轉(zhuǎn)瞬即逝的內(nèi)容,轉(zhuǎn)向構(gòu)建可以長久存在的虛擬世界。這背后究竟是怎樣的技術(shù)、創(chuàng)意和遠見在驅(qū)動?
![]()
技術(shù)鐵三角撐起新世界
WorldLabs的宏大敘事并非空中樓閣,其背后是堅不可摧的技術(shù)鐵三角:無懈可擊的幾何完整性、高度統(tǒng)一的風格一致性,以及擁抱開放的技術(shù)生態(tài)。
首先,它在幾何結(jié)構(gòu)上實現(xiàn)了驚人的突破。傳統(tǒng)的生成模型常常受限于深度圖或點云的缺陷,生成的3D空間總有點“紙片感”。但Marble生成的幾何結(jié)構(gòu),復雜且完整,甚至允許用戶自由漫游,探索輸入圖像“背后”那些看不見的隱藏空間。這才是真正意義上的自由視點。
![]()
更關(guān)鍵的是,模型具備了強大的“記憶力”。它在風格保持和幾何連貫性上表現(xiàn)得出奇地好。這意味著,你可以讓它生成一個賽博朋克風格的街道,再生成一個卡通風格的房間,然后將這兩個完全獨立的場景無縫拼接起來,構(gòu)成一個更大、更多元的世界,而不會有任何違和的“拼湊感”。
這種能力解決了長期以來AI生成內(nèi)容的一大痛點。

WorldLabs并沒有把這項技術(shù)藏起來。他們選擇了一種更開放的姿態(tài),提供了一個名為Spark的開源渲染庫。通過這個庫,開發(fā)者可以輕松地將模型生成的高斯點云(Gaussiansplatting)集成到主流的網(wǎng)頁3D引擎Three.js中。
這一下就大大降低了下游應用的開發(fā)門檻。無論你用的是PC、手機還是VR頭顯,都能流暢地體驗這些3D世界。這是一種平臺化的雄心。
![]()
給想象力一塊數(shù)字土壤
Marble模型顯然不想只停留在技術(shù)展示層面,它更渴望成為一塊能孕育無限想象力的數(shù)字土壤,一個賦予創(chuàng)作者極致自由的創(chuàng)意畫布。
從充滿未來感的賽博朋克都市,到童趣盎然的海綿寶寶海底世界,無論你的審美多么獨特,這個模型都能精準捕捉并將其轉(zhuǎn)化為一個邏輯自洽、風格統(tǒng)一的3D場景。它能把扁平的卡通畫“吹”成立體的空間,也能將細節(jié)豐富的寫實照片轉(zhuǎn)化為可供漫游的世界。

這讓創(chuàng)作者的身份發(fā)生了轉(zhuǎn)變。他們不再僅僅是內(nèi)容的“生成者”,更成了自己世界的“探險家”。
有早期用戶分享說,他們用一張普通的旅行照片,生成了一個可以不斷放大、探索的世界,結(jié)果在角落里發(fā)現(xiàn)了很多意想不到的秘密和細節(jié)。這種“發(fā)現(xiàn)”的樂趣,正是其魅力所在。
這種全新的創(chuàng)作模式,已經(jīng)讓專業(yè)領(lǐng)域的人嗅到了變革的氣息。一位虛幻引擎的VR電影制作人興奮地表示,他非常希望能用這項技術(shù)來構(gòu)思電影故事和制作互動體驗。
![]()
可以想象,未來的導演或許不再需要搭建實體布景,而是可以先在AI生成的連貫場景中,像玩游戲一樣規(guī)劃鏡頭運動和演員走位。這無疑將極大地解放生產(chǎn)力。
更重要的是,WorldLabs目前向所有人敞開了大門,Beta預覽版完全免費。這讓普通人也能過一把“創(chuàng)世神”的癮,親手創(chuàng)造屬于自己的3D世界。
![]()
AI大神們的空間野望
WorldLabs的顛覆性,根源在于其團隊對一個核心理念的深刻洞察——“空間智能”。在公司看來,理解三維空間的能力,是比語言能力更基礎(chǔ)、更底層的智能形式。
公司的使命,就是推動AI從理解2D像素的層面,躍升至能夠感知、生成并與之交互的3D時空。這完美解釋了為什么他們不執(zhí)著于生成孤立的角色或物體,而是專注于構(gòu)建一個持久且連貫的“環(huán)境”。
![]()
這個宏大愿景的背后,站著一個堪稱“夢之隊”的創(chuàng)始團隊。
團隊的靈魂人物,自然是華人AI科學家李飛飛。而她的幾位聯(lián)合創(chuàng)始人,個個都是其所在領(lǐng)域的開創(chuàng)性人物。本·米爾登霍爾,來自谷歌,是鼎鼎大名的神經(jīng)輻射場技術(shù)的共同提出者之一,這項技術(shù)是現(xiàn)代3D重建的基石。
![]()
賈斯汀·約翰遜,曾是李飛飛的學生,后任職于Meta,是實時風格轉(zhuǎn)換技術(shù)的首創(chuàng)者。ChristophLassner,則在Meta和EpicGames都工作過,他首創(chuàng)的可微分渲染器Pulsar,為今天流行的高斯分布技術(shù)鋪平了道路。
這些頂尖技術(shù)大牛的知識背景,仿佛一塊塊完美的拼圖,共同構(gòu)成了實現(xiàn)“空間智能”這一宏偉藍圖所必需的技術(shù)版圖。
![]()
這個愿景也迅速凝聚了整個科技圈的共識。顧問團隊里有華人學者謝賽寧和吳佳俊的身影。投資人名單更是星光熠熠,A16Z、NEA、RadicalVentures等頂級機構(gòu)紛紛入局,個人投資者中赫然出現(xiàn)了JeffDean、GeoffreyHinton、ReidHoffman和AndrejKarpathy這些如雷貫耳的名字。
這證明了,無論是學界泰斗還是產(chǎn)業(yè)巨頭,都對WorldLabs所描繪的未來投下了信任票。
![]()
結(jié)語
WorldLabs和它的Marble模型,所做的遠不止是展示一項令人驚嘆的技術(shù)。它更像是在宣告一個新紀元的到來:
一個人人都能創(chuàng)造、探索、分享和“棲居”于專屬3D世界的未來。它用事實證明,AI的能力邊界正在從平面走向立體,從瞬間走向永恒。
![]()
隨著未來API的逐步開放和技術(shù)生態(tài)的不斷成熟,這種建立在“空間智能”之上的全新能力,必將從根本上重塑我們與數(shù)字世界的互動方式。
它將如何改變游戲、電影、社交乃至教育?其真正的影響力,或許將遠遠超出我們今天最大膽的想象。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.