網易首頁 > 網易號 > 正文申請入駐

速度提升百倍！XR空間計算正迎來“UGC大基建”時代

2026-03-13 18:06:26　來源: VR陀螺

廣東舉報

分享至

文/VR陀螺冉啟行

2026 年，AI 眼鏡正在快速迭代，VR/MR 頭顯的形態也在持續向更輕、更薄演進。

隨著硬件門檻的逐步降低，開發者和內容創作者對高質量 3D 資產的需求正在同步提速——無論是 VR/MR 游戲場景、AR 應用還是工業數字孿生，3D 內容的生產效率與質量正在被重新抬上核心議程。然而，傳統三維建模的周期長、門檻高、成本難以攤薄，即便是專業團隊，也很難用人力跟上內容需求增長的節奏。

visionOS（圖源：網絡）

在 GDC 2026 前夕，通用人工智能公司 VAST 正式發布了 Tripo P1.0（Smart Mesh），與旗艦模型 Tripo H3.1 相比，它在內容生成上交出了一份完全不同范式的答案。Tripo P1.0 實現了第一次在原生三維空間里做概率生成，不再依賴序列化「拼接」幾何，而是在高維噪聲場中直接演化出結構完備、拓撲規整的三維網格，最快約 2 秒即可產出可直接進 Unity、UE 等引擎的專業級 3D 資產。

Tripo P1.0 可以看作 AI 3D 大模型算法范式的全新分水嶺，它讓速度、質量與工程可用性不再是互相犧牲的三難選擇，開始同時成立。對 XR 等重 3D 資產的行業來說，這意味著 AI 3D 進一步邁入了商用級規模化的新階段。

圖源：網絡

從維度詛咒到原生三維，Smart Mesh做的是底層算法重構

傳統 AI 3D 生成模型，在真正碰到可落地這件事時，往往會被維度詛咒卡住。三維空間數據過于龐大、結構過于復雜，模型不得不通過體素網格、體渲染場或點云序列等形式先降維、再線性化處理，再通過一連串后處理把結果勉強還原成可用網格。這類路徑在學術論文和 Demo 中看上去可行，但一旦落到游戲、工業或 XR 生產線，問題就會集中爆發——生成速度慢、拓撲臟亂、細節不穩定、引擎兼容性差。

VAST 首席科學家曹炎培對此表示：“過去大家習慣了在 2D 矩陣或 1D 序列上做理解和生成，將處理文字、圖像、視頻的方法遷移到 3D上，本質上還是在用不適合三維的表示去逼近三維，所以模型在表征層面會非常吃力。因為三維空間本身有它自己的結構特征，比如各向同性、連續性和拓撲約束。嚴格來說，問題并不在于維度高本身，而在于沒有找到三維數據真正合適的底層表征。經典機器學習里也一樣，所謂‘維度詛咒’很多時候并不是維度本身不可解，而是你還沒有找到它背后的低維流形和本征結構。一旦表征對了，很多原來看起來像詛咒的問題，其實都會被重新改寫。比如像我們現在做Tripo P1.0模型這樣找到正確的底層表征，這就不再是大問題。”

圖生3D模型演示（圖源：VR陀螺）

Tripo P1.0（Smart Mesh）的技術路徑是繞開了原來的一整套補丁式工程。官方將其定義為一套原生三維生成框架，不是在 2D 投影或隱式體上間接優化，而是讓概率生成引擎首次在純三維坐標空間中直接運行，從一片高維噪聲場出發，在空間中逐層「生長」出幾何結構。模型不再是按序號逐點預測頂點，而是在統一的三維特征場上，先確定宏觀結構，再向局部細節收斂，讓復雜空間坐標同步收束成型。

在這個過程中，Smart Mesh 把原本顯式編碼在規則里的大量幾何先驗，全部收進了高維潛在空間。每一個頂點不僅僅是一個坐標，而是帶著豐富上下文關系的潛在向量，彼此之間的連接關系通過潛在拓撲映射被持續更新與收斂。當概率空間收斂完成，模型直接涌現出一個幾何穩定、拓撲嚴謹、可編輯性良好的網格。

3D模型演示

這種重構帶來的直接結果，是模型不再被迫走“慢而精”或“快而糙”的老路，而是在統一的原生三維概率框架下，同時兼顧宏觀結構、局部拓撲與細節紋理，為后續所有下游工程環節（減面、骨骼、動畫、渲染）預留出最大空間。

百倍推理效率提升，秒級3D模型生成技術

底層重構到底能給前端帶來多大改變？我們在 Tripo Studio 中直接上手跑了跑。

輸入文本或參考圖后，幾乎不需要漫長的等待。根據官方披露的數據，Smart Mesh 可以在約 2 秒內生成面數從數百到兩萬不等、拓撲規整的網格模型。受面數、當前網絡環境及云端服務器擁擠程度影響，實際測試體感用時在 10 秒左右。但相比于行業普遍水平，這已經實現了量級的跨越。

曹炎培表示：“我們用比較優雅的數學推導繞過了之前離散組合的暴力算力消耗，這也是為什么之前的方法可能要三五百秒，而我們五六秒就能生成一個網格。背后所需算力被大大減少，不是強行壓縮計算量，而是免除了之前方法中因強加因果和排序所帶來的不必要計算。”

文生3D模型演示（圖源：VR陀螺）

最讓我們在意的其實不是速度，而是網格的質量。以往 AI 生成的模型往往伴隨著破面和雜亂的邊線，但 Smart Mesh 跑出來的低多邊形網格，邊線清爽、結構合理。

曹炎培對此表示：“我們相當于把擁有多年經驗的藝術家才能做出的拓撲布線邏輯，變成了算法上的直覺。普通人通過一張圖或一個想法就能瞬間獲得一個外觀正確、結構符合工業標準的資產，不管是創意設計還是生產力用戶，都能回歸到意圖本身。”

文生3D模型演示，局部重繪調整（圖源：VR陀螺）

這種“工業級直覺”早已在實際業務中顯現價值。其原有的 H 系列模型在技術與商業化上已穩居行業頭部，并深度服務于網易《燕云十六聲》、拓竹科技等標桿客戶，實現了 3D 打印與游戲 UGC 的大規模產業落地。在原有路線已領跑行業、商業價值全面兌現的背景下，團隊依然堅持從底層算法范式進行顛覆式創新。 Smart Mesh 的出現，從某種程度上看，也代表著 VAST 的這家公司底色——極客精神。

從視覺擬真向功能性演進，AI 3D開啟UGC互動內容新時代

今年 3 月，VAST 剛宣布完成 5000 萬美元的 A 輪融資。據介紹，這筆資金將主要用于 VAST 繼續迭代核心算法、積累數據，以及建設 UGC 互動內容平臺。

如果說 AI 3D 的 1.0 時代是在追求“看起來真”，那么以 P1.0 為代表的 2.0 時代則是在追求“功能性”。曹炎培表示：“未來很快，大家就會模糊‘3D 建模’的概念。用戶會回歸到創造 3D 模型的原始意圖，而不是糾結于怎么用工具得到它。在當今 AI 時代，VAST 提供的 AI 3D 生成能力是像輸入法、攝像頭一樣的基礎能力。”

AR應用演示（圖源：AI生成）

在 VAST 的技術版圖中，高質量的 3D 資產構成了交互世界中持久性的“狀態”，而“世界模型”則負責建模狀態之間的“轉換”——比如角色怎么和環境交互、交互過程應該怎樣自然地呈現和生成。

當下的 XR 產業，高質量內容生產的瓶頸日益凸顯。未來的空間計算設備，用戶需要的絕不僅僅是幾個預先做好的 Demo，而是海量的、個性化的、甚至實時生成的 3D 世界。

曹炎培指出：“當生成一個標準的 3D 交互資產只需要幾秒，想象力就會被無限放大，用戶不會覺得利用三維資產做想做的事情還有任何障礙。這種 2.0 時代的技術，把之前 1.0 時代速度、質量和可用性的‘不可能三角’變為可能并同時成立。”

通過降低門檻，讓不具備專業技能的普通人也能通過自然語言構建交互式內容，VAST 正在嘗試定義下一代 UGC 互動平臺的基石。在這一輪內容生產邏輯的重構中，行業亟需一個既快、又穩、還能直接接入工業管線的 AI 3D 底座，而 VAST 正試圖通過 Smart Mesh 證明，他們就是那個 XR 時代“大基建”的提供方。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.