快科技4月12日消息,隨著3A大作對畫面精度的要求持續升級,高精度材質紋理包的體積水漲船高。曾經的主流8GB顯存顯卡,如今動輒遭遇爆顯存、畫面卡頓、強制降畫質的窘境,也被不少玩家調侃為"殘廢卡"。
而NVIDIA全新的RTX神經紋理壓縮技術(簡稱NTC),或許能徹底改變這一現狀。
![]()
近日,Tom'sHardware對這項技術完成了多顯卡、全平臺的專項實測。NTC是隨RTX50系列顯卡一同發布的AI驅動技術,依托顯卡Tensor核心(NVIDIA顯卡內置的AI加速運算核心)完成紋理的壓縮與解壓,最高可將顯存需求降低超80%,實測最高降幅達85%,同時畫面畫質還優于游戲行業沿用多年的傳統壓縮方案。這一結果,也讓玩家對"8GB顯卡再戰十年"有了切實的期待。
從技術原理來看,NTC是基于機器學習的紋理壓縮與解壓方案,也是NVIDIA神經著色渲染新范式的核心技術之一。它跳出了傳統BCn塊壓縮格式(游戲行業通用的傳統區塊紋理壓縮標準)4×4像素的固定限制,在壓縮階段就將原始紋理轉化為小型神經網絡權重與潛在特征組合。
需要明確的是,NTC是確定性解碼技術,并非生成式AI,不存在AI幻覺的風險。
為適配不同層級的硬件,NTC在DirectX 12接口下提供三種運行模式,另一主流接口Vulkan因無對應配套功能,僅支持其中兩種(不支持Inference on Feedback)。
第一種是加載時推理模式(Inference on Load)。它會在游戲或地圖加載階段,全程在GPU內完成NTC紋理的解壓,并同步轉碼為傳統BCn格式。這種模式和原生BCn紋理的渲染性能完全一致,沒有任何渲染階段的性能開銷,還能大幅縮小游戲的磁盤占用體積、降低PCIe總線傳輸壓力,唯一的不足是無法降低運行時的顯存占用。
第二種是采樣時推理模式(Inference on Sample),這也是大眾認知中神經紋理壓縮的核心形態,更是顯存壓縮能力最強的模式。它會在紋理采樣時,通過預訓練的多層感知機(簡稱MLP,一種輕量化小型神經網絡),實時解碼當前所需的像素數據,最終實現最高85%的顯存占用降幅。
第三種是反饋時推理模式(Inference on Feedback),僅支持DirectX12接口。它會通過采樣器反饋(DirectX12專屬圖形功能,可精準識別渲染當前畫面所需的紋理區塊),僅解壓渲染當前畫面需要的紋理部分,是前兩種模式的折中方案,顯存降幅不如采樣時推理模式,但性能開銷更低,整體表現介于兩者之間。
![]()
Tom's Hardware用行業通用的Intel Sponza標準場景完成了量化測試,實測數據完全貼合官方標稱的壓縮能力,原始無損參考材質的紋理顯存占用為6830MB。加載時推理模式(Inference on Load)將紋理轉碼為BCn格式后,顯存占用為2041MB。
而采樣時推理模式(Inference on Sample)下,紋理顯存占用僅為303MB。實現了85%以上的紋理顯存占用。對比原始無損參考材質,顯存降幅更是超過95%。
同時實測顯示,該模式下的畫面效果,比轉碼后的BCn紋理更接近原始參考材質,幾乎能做到完美復刻。而在NVIDIA官方的托斯卡納別墅場景測試中,同畫質下的紋理顯存占用,可從傳統BCn格式的6.5GB直接降至NTC格式的970MB。
測試團隊覆蓋了從旗艦到入門級的多款NVIDIA顯卡,以及筆記本移動平臺,核心測試指標為幀時間(渲染單幀畫面所需的時間,數值越低畫面流暢度越高)。
RTX 5090在4K分辨率下,采樣時推理模式搭配TAA(時間抗鋸齒,主流的畫面平滑技術,用于消除畫面鋸齒、提升畫面純凈度),幀時間僅比零開銷的加載時推理模式增加0.09ms,性能損耗幾乎可以忽略。
![]()
![]()
![]()
![]()
![]()
![]()
主流RTX 5070在適配的1440P分辨率下,該模式的幀時間開銷在0.50-0.70ms之間。入門級RTX 5060在適配的1080P分辨率下,幀時間開銷穩定在0.60-0.70ms。即便是筆記本端的RTX 4060移動顯卡(8GB顯存),1080P下的幀時間開銷也僅0.70-0.85ms。
![]()
![]()
測試團隊同時明確,測試場景僅包含基礎前向渲染與抗鋸齒流程,實際3A游戲有大量不受NTC影響的渲染通道,因此這項技術在實際游戲中的相對性能損耗,會比測試數據更低。
對于8GB顯存顯卡來說,只要游戲基礎幀率充足,用小幅性能開銷換取不降級的紋理畫質,是實打實的凈收益。
這項技術也有明確的使用門檻。采樣時推理模式必須開啟隨機紋理過濾(簡稱STF,用于優化紋理畫質、減少畫面瑕疵),關閉抗鋸齒時會產生畫面噪點。DLSS能完全消除這類噪點,TAA僅能完成大部分清理,無法徹底消除,因此該模式優先推薦搭配DLSS使用。
NTC技術開發者、NVIDIA資深工程師Alexey Panteleev表示,采樣時推理模式更適合高性能顯卡,加載時推理模式可覆蓋全平臺硬件。游戲廠商可按單紋理選擇是否啟用NTC,也能給玩家開放模式選擇,讓用戶根據自身硬件情況決定。
值得一提的是,NTC并非NVIDIA專屬技術,它可兼容AMD、Intel顯卡的AI加速單元,行業爆料稱索尼PS6主機也有望采用同類技術。
目前尚無游戲正式支持該技術,但全行業布局已落地,規模化商用近在眼前。它不僅能讓小顯存老顯卡重獲新生,也為實時圖形渲染開辟了全新的技術方向。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.