在近期舉行的 Advancing AI 2025 大會上,AMD不僅推出了備受矚目的 Instinct MI350 系列 AI 加速卡和 ROCm 7 開發(fā)平臺,更詳細解讀了其基于全新 Zen 5 架構(gòu)的銳龍線程撕裂者 9000 系列處理器及Radeon AI PRO 專業(yè)顯卡的技術(shù)細節(jié)。
![]()
此次發(fā)布旨在進一步鞏固 AMD 在高性能工作站市場的領(lǐng)導(dǎo)地位,并獲得了四大 OEM 合作伙伴的鼎力支持,共同展示了搭載新平臺的領(lǐng)先產(chǎn)品。
工作站市場:穩(wěn)健增長的專業(yè)高地
工作站市場作為介于服務(wù)器與個人 PC 之間的專業(yè)計算領(lǐng)域,以其對高性能、高可靠性的嚴苛要求而著稱。IDC 數(shù)據(jù)顯示,全球工作站市場規(guī)模預(yù)計將從 2024 年的近 700 萬臺增長至 2029 年的約 900 萬臺,展現(xiàn)出持續(xù)穩(wěn)健的增長態(tài)勢。
![]()
AMD 在該領(lǐng)域擁有完善且強大的產(chǎn)品線,從移動端的銳龍 AI PRO 系列到桌面級的銳龍 PRO、銳龍線程撕裂者 PRO 系列,以及 Radeon PRO、Radeon AI PRO 系列顯卡,構(gòu)建了完整的平臺解決方案。
![]()
自 2017 年誕生以來,AMD 線程撕裂者處理器一直以其卓越性能主導(dǎo)市場。例如,上一代旗艦線程撕裂者 PRO 7995WX在多線程性能上相較英特爾至強 W9-3595X 領(lǐng)先高達 80%。值得強調(diào)的是,線程撕裂者系列始終保持高速迭代,僅用六年時間,其架構(gòu)已進化四代,制造工藝從 14nm 躍升至 5nm,核心數(shù)增長 6 倍(從 16 核至 96 核),緩存容量擴大 12 倍,內(nèi)存與 PCIe 帶寬均實現(xiàn)了 4 倍提升,展現(xiàn)了 AMD 在技術(shù)創(chuàng)新上的不懈追求。
Zen 5 架構(gòu)賦能:性能與能效的雙重飛躍
線程撕裂者 9000 系列的核心亮點在于全面升級至最新的Zen 5 架構(gòu)。
![]()
此架構(gòu)帶來了多項關(guān)鍵改進,包括:
?顯著提升的單線程與多線程性能:通過優(yōu)化計算負載的全流水線處理能力,實現(xiàn)性能的質(zhì)的飛躍。
?512 位數(shù)據(jù)路徑 AVX-512 指令集支持:提升了在高性能計算和 AI 工作負載中的處理效率。
?增強的 ISA 指令能力:進一步優(yōu)化了指令集架構(gòu),提升了代碼執(zhí)行效率。
?DDR5-6400 內(nèi)存支持:提供高達 410GB/s 的理論峰值帶寬,并支持 EXPO 一鍵超頻至 DDR5-7000+。
?更高能效:通過改進分支預(yù)測精度、同步多線程效率和功耗管理,實現(xiàn)同等功耗下更高的性能輸出。
![]()
Zen 5 架構(gòu)在 10 個工作站基準測試中,平均 IPC(每時鐘周期指令數(shù))提升達 16%,在 SPEC AI/ML 基準測試中平均 IPC 提升更是達到 25%。
![]()
線程撕裂者 9000 系列處理器延續(xù)了 Chiplets 整合封裝設(shè)計,最多集成 12 個 4nm 工藝的 CCD 和 1 個 IOD,最高可實現(xiàn) 96 核心 192 線程。每個核心配備 1MB 二級緩存,每個 CCD 包含 8MB 二級緩存,所有核心共享 32MB 三級緩存,合計高達 480MB 緩存。
![]()
所有 PRO 9000WX 系列型號(9995WX、9985WX、9975WX、9965WX、9955WX、9945WX)和 9000 系列型號(9980X、9970X、9960X)的加速頻率均提升至 5.4GHz,熱設(shè)計功耗保持 350W。新系列繼續(xù)兼容 sTR5 平臺,為現(xiàn)有用戶提供了便捷的升級路徑。
性能實測:碾壓級領(lǐng)先競爭對手
![]()
在實際應(yīng)用負載中,旗艦型號PRO 9995WX相較于上一代 PRO 7955WX,性能提升幅度在 13% 到 26% 之間。
![]()
與競品英特爾至強 W9-3595X (60 核心 120 線程) 相比,PRO 9995WX 展現(xiàn)出全面碾壓態(tài)勢。在 CPU 密集型應(yīng)用中,其領(lǐng)先優(yōu)勢可輕松超過 100%。即使在需要 CPU 和 GPU 協(xié)同工作的負載下,PRO 9995WX 依然全面大幅領(lǐng)先。
![]()
面對最新的 AI 工作負載,無論是大模型 Tokens 生成速度、文生圖速度,還是內(nèi)容創(chuàng)作,PRO 9995WX 均表現(xiàn)出壓倒性優(yōu)勢。即便是 64 核心的非專業(yè)級 9980X,也能夠輕松領(lǐng)先至強 W9-3595X 至少 20%,最高甚至達到 108%。
Radeon AI PRO 顯卡:AI 時代的專業(yè)圖形利器
隨著 AI 時代的到來,專業(yè)顯卡在工作站中的作用愈發(fā)關(guān)鍵。AMD 將其專業(yè)顯卡系列更名為Radeon AI PRO,以突出其在 AI 領(lǐng)域的強大實力。Radeon AI PRO 顯卡與銳龍 AI 處理器、內(nèi)存等組件共同構(gòu)成了完整的 AI 解決方案,并通過 ROCm 軟件平臺如虎添翼。
![]()
Radeon AI PRO 顯卡基于RDNA 4 架構(gòu),采用臺積電 4nm 工藝,集成 539 億個晶體管。新架構(gòu)優(yōu)化了指令處理器和緩存系統(tǒng),并升級了第二代 AI 加速器,顯著提升了 Tensor 計算能力,新增 8 位浮點數(shù)據(jù)格式并支持結(jié)構(gòu)化稀疏性。
![]()
首款產(chǎn)品Radeon AI PRO R9700配備 64 個 CU 計算單元(4096 個流處理器)、64 個光追加速器和 128 個 AI 加速器,搭載 256-bit 32GB GDDR6 顯存。其峰值性能在 FP16 半精度浮點下可達 96 TFLOPS,INT4 稀疏精度下為 1531 TOPS。整卡功耗 300W。值得一提的是,Radeon AI PRO R9700 將提供 AMD 公版及眾多 AIB 品牌產(chǎn)品。
![]()
Radeon AI PRO R9700 相較于上一代 Radeon PRO W7800,在核心數(shù)更少的情況下,實現(xiàn)了 FP32 性能持平,F(xiàn)P16/BF16 性能翻倍,INT8/INT4 性能更是達到 4 倍,并新增了 FP8 和結(jié)構(gòu)化稀疏性支持。
![]()
在 DeepSeek-R1 大模型輸出 Tokens 速度測試中,R9700 可輕松碾壓 W7800,尤其在 70-80 億參數(shù)規(guī)模時優(yōu)勢顯著,甚至領(lǐng)先一倍有余。32GB 顯存配置能夠滿足流行大模型的典型顯存占用需求,并預(yù)留未來擴展空間。
![]()
Radeon AI PRO R9700 還支持靈活的多卡并行,目前最多可實現(xiàn)四卡并行,后續(xù)將升級至八卡,以更好地滿足并發(fā)實例應(yīng)用。
OEM 伙伴:強強聯(lián)合,共筑工作站生態(tài)
AMD 線程撕裂者系列憑借其卓越性能和完善的軟件生態(tài),已獲得行業(yè)廣泛認可。戴爾、惠普、聯(lián)想、超微等全球領(lǐng)先的 OEM 伙伴持續(xù)為 AMD 提供大力支持。
![]()
?戴爾 Precision 7875 工作站:支持撕裂者 PRO 7000WX/9000WX 系列,最高 96 核心,提供高達 2TB DDR5 內(nèi)存和豐富的擴展插槽。
?惠普 Z6 G5 A 工作站:已加入撕裂者 PRO W9000X 系列,同時支持最新的 NVIDIA Blackwell 專業(yè)顯卡,最多三卡并行。
?聯(lián)想 ThinkStation P620、P8:聯(lián)想作為 AMD 工作站的頭號伙伴,其 P8 系列已升級支持撕裂者 PRO 9000WX,最高 96 核心。
?超微工作站:提供多樣化產(chǎn)品,包括標準塔式(可選風(fēng)冷、液冷)及獨特的 2U 機架式,可支持最多四塊全高全長雙插槽專業(yè)顯卡并行。
結(jié)語:撕裂者神話續(xù)寫,AMD YES 精神永存
![]()
自 2017 年誕生以來,銳龍線程撕裂者處理器一直是高性能計算領(lǐng)域的標桿,甚至迫使競爭對手放棄了高端桌面市場,創(chuàng)造了微處理器歷史上的一個“神話”。盡管缺乏直接競爭威脅,線程撕裂者系列卻打破了“擠牙膏”的慣例,每一代都在超越自我。
![]()
最新的線程撕裂者 9000 系列秉持初心,以全新的 Zen 5 架構(gòu)再次詮釋了“AMD YES”的精髓。其無與倫比的性能再次飛躍,全方位碾壓競品;更豐富的 I/O 接口,輕松實現(xiàn)各種擴展;更高超的能效,有效降低客戶部署成本;以及第一時間推出的豐富 OEM 產(chǎn)品,靈活滿足用戶不同需求。
搭配全新的 Radeon AI PRO 專業(yè)顯卡和 ROCm 7 開發(fā)軟件,線程撕裂者 9000 系列組成了迄今為止最為強大的專業(yè)工作站解決方案,無論是圖形渲染還是高強度 AI 負載,都能輕松應(yīng)對,為專業(yè)人士提供無與倫比的計算體驗。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.