文/VR陀螺 冉啟行
2026 年,AI 眼鏡正在快速迭代,VR/MR 頭顯的形態也在持續向更輕、更薄演進。
隨著硬件門檻的逐步降低,開發者和內容創作者對高質量 3D 資產的需求正在同步提速——無論是 VR/MR 游戲場景、AR 應用還是工業數字孿生,3D 內容的生產效率與質量正在被重新抬上核心議程。然而,傳統三維建模的周期長、門檻高、成本難以攤薄,即便是專業團隊,也很難用人力跟上內容需求增長的節奏。
![]()
visionOS(圖源:網絡)
在 GDC 2026 前夕,通用人工智能公司 VAST 正式發布了 Tripo P1.0(Smart Mesh),與旗艦模型 Tripo H3.1 相比,它在內容生成上交出了一份完全不同范式的答案。Tripo P1.0 實現了第一次在原生三維空間里做概率生成,不再依賴序列化「拼接」幾何,而是在高維噪聲場中直接演化出結構完備、拓撲規整的三維網格,最快約 2 秒即可產出可直接進 Unity、UE 等引擎的專業級 3D 資產。
Tripo P1.0 可以看作 AI 3D 大模型算法范式的全新分水嶺,它讓速度、質量與工程可用性不再是互相犧牲的三難選擇,開始同時成立。對 XR 等重 3D 資產的行業來說,這意味著 AI 3D 進一步邁入了商用級規模化的新階段。
![]()
圖源:網絡
從維度詛咒到原生三維,Smart Mesh做的是底層算法重構
傳統 AI 3D 生成模型,在真正碰到可落地這件事時,往往會被維度詛咒卡住。三維空間數據過于龐大、結構過于復雜,模型不得不通過體素網格、體渲染場或點云序列等形式先降維、再線性化處理,再通過一連串后處理把結果勉強還原成可用網格。這類路徑在學術論文和 Demo 中看上去可行,但一旦落到游戲、工業或 XR 生產線,問題就會集中爆發——生成速度慢、拓撲臟亂、細節不穩定、引擎兼容性差。
VAST 首席科學家曹炎培對此表示:“過去大家習慣了在 2D 矩陣或 1D 序列上做理解和生成,將處理文字、圖像、視頻的方法遷移到 3D上,本質上還是在用不適合三維的表示去逼近三維,所以模型在表征層面會非常吃力。因為三維空間本身有它自己的結構特征,比如各向同性、連續性和拓撲約束。嚴格來說,問題并不在于維度高本身,而在于沒有找到三維數據真正合適的底層表征。經典機器學習里也一樣,所謂‘維度詛咒’很多時候并不是維度本身不可解,而是你還沒有找到它背后的低維流形和本征結構。一旦表征對了,很多原來看起來像詛咒的問題,其實都會被重新改寫。比如像我們現在做Tripo P1.0模型這樣找到正確的底層表征,這就不再是大問題。”
![]()
圖生3D模型演示(圖源:VR陀螺)
Tripo P1.0(Smart Mesh)的技術路徑是繞開了原來的一整套補丁式工程。官方將其定義為一套原生三維生成框架,不是在 2D 投影或隱式體上間接優化,而是讓概率生成引擎首次在純三維坐標空間中直接運行,從一片高維噪聲場出發,在空間中逐層「生長」出幾何結構。模型不再是按序號逐點預測頂點,而是在統一的三維特征場上,先確定宏觀結構,再向局部細節收斂,讓復雜空間坐標同步收束成型。
在這個過程中,Smart Mesh 把原本顯式編碼在規則里的大量幾何先驗,全部收進了高維潛在空間。每一個頂點不僅僅是一個坐標,而是帶著豐富上下文關系的潛在向量,彼此之間的連接關系通過潛在拓撲映射被持續更新與收斂。當概率空間收斂完成,模型直接涌現出一個幾何穩定、拓撲嚴謹、可編輯性良好的網格。
![]()
3D模型演示
這種重構帶來的直接結果,是模型不再被迫走“慢而精”或“快而糙”的老路,而是在統一的原生三維概率框架下,同時兼顧宏觀結構、局部拓撲與細節紋理,為后續所有下游工程環節(減面、骨骼、動畫、渲染)預留出最大空間。
百倍推理效率提升,秒級3D模型生成技術
底層重構到底能給前端帶來多大改變?我們在 Tripo Studio 中直接上手跑了跑。
輸入文本或參考圖后,幾乎不需要漫長的等待。根據官方披露的數據,Smart Mesh 可以在約 2 秒內生成面數從數百到兩萬不等、拓撲規整的網格模型。受面數、當前網絡環境及云端服務器擁擠程度影響,實際測試體感用時在 10 秒左右。但相比于行業普遍水平,這已經實現了量級的跨越。
曹炎培表示:“我們用比較優雅的數學推導繞過了之前離散組合的暴力算力消耗,這也是為什么之前的方法可能要三五百秒,而我們五六秒就能生成一個網格。背后所需算力被大大減少,不是強行壓縮計算量,而是免除了之前方法中因強加因果和排序所帶來的不必要計算。”
![]()
文生3D模型演示(圖源:VR陀螺)
最讓我們在意的其實不是速度,而是網格的質量。以往 AI 生成的模型往往伴隨著破面和雜亂的邊線,但 Smart Mesh 跑出來的低多邊形網格,邊線清爽、結構合理。
曹炎培對此表示:“我們相當于把擁有多年經驗的藝術家才能做出的拓撲布線邏輯,變成了算法上的直覺。普通人通過一張圖或一個想法就能瞬間獲得一個外觀正確、結構符合工業標準的資產,不管是創意設計還是生產力用戶,都能回歸到意圖本身。”
![]()
文生3D模型演示,局部重繪調整(圖源:VR陀螺)
這種“工業級直覺”早已在實際業務中顯現價值。其原有的 H 系列模型在技術與商業化上已穩居行業頭部,并深度服務于網易《燕云十六聲》、拓竹科技等標桿客戶,實現了 3D 打印與游戲 UGC 的大規模產業落地。在原有路線已領跑行業、商業價值全面兌現的背景下,團隊依然堅持從底層算法范式進行顛覆式創新。 Smart Mesh 的出現,從某種程度上看,也代表著 VAST 的這家公司底色——極客精神。
從視覺擬真向功能性演進,AI 3D開啟UGC互動內容新時代
今年 3 月,VAST 剛宣布完成 5000 萬美元的 A 輪融資。據介紹,這筆資金將主要用于 VAST 繼續迭代核心算法、積累數據,以及建設 UGC 互動內容平臺。
如果說 AI 3D 的 1.0 時代是在追求“看起來真”,那么以 P1.0 為代表的 2.0 時代則是在追求“功能性”。曹炎培表示:“未來很快,大家就會模糊‘3D 建模’的概念。用戶會回歸到創造 3D 模型的原始意圖,而不是糾結于怎么用工具得到它。在當今 AI 時代,VAST 提供的 AI 3D 生成能力是像輸入法、攝像頭一樣的基礎能力。”
![]()
AR應用演示(圖源:AI生成)
在 VAST 的技術版圖中,高質量的 3D 資產構成了交互世界中持久性的“狀態”,而“世界模型”則負責建模狀態之間的“轉換”——比如角色怎么和環境交互、交互過程應該怎樣自然地呈現和生成。
當下的 XR 產業,高質量內容生產的瓶頸日益凸顯。未來的空間計算設備,用戶需要的絕不僅僅是幾個預先做好的 Demo,而是海量的、個性化的、甚至實時生成的 3D 世界。
曹炎培指出:“當生成一個標準的 3D 交互資產只需要幾秒,想象力就會被無限放大,用戶不會覺得利用三維資產做想做的事情還有任何障礙。這種 2.0 時代的技術,把之前 1.0 時代速度、質量和可用性的‘不可能三角’變為可能并同時成立。”
通過降低門檻,讓不具備專業技能的普通人也能通過自然語言構建交互式內容,VAST 正在嘗試定義下一代 UGC 互動平臺的基石。在這一輪內容生產邏輯的重構中,行業亟需一個既快、又穩、還能直接接入工業管線的 AI 3D 底座,而 VAST 正試圖通過 Smart Mesh 證明,他們就是那個 XR 時代“大基建”的提供方。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.