作者:Arm 云 AI 事業(yè)部產(chǎn)品解決方案副總裁 Dermot O’Driscoll
2025 年初,Arm 曾預測:Arm 架構將占據(jù)近半數(shù) 2025 年出貨到頭部云服務提供商的算力。
根據(jù)今年前三個季度的實際出貨數(shù)據(jù),市場正向著這一預測目標穩(wěn)步邁進。這些搭載 Arm 架構的服務器的意義遠不止于一個統(tǒng)計數(shù)字,更重要的是它們構成了融合型人工智能 (AI) 數(shù)據(jù)中心這一新型基礎設施的計算核心。從云原生服務到最具挑戰(zhàn)性的 AI 工作負載,超大規(guī)模云服務提供商正逐步將基于 Arm 的定制化計算作為標準路徑,以此實現(xiàn)性能、功耗與規(guī)模的平衡。
近期發(fā)布的 Amazon Graviton5 正是這一新模式的典范。作為該系列的第五代產(chǎn)品,Graviton5 凝結了 Arm 架構多年積累的能效優(yōu)勢,專為現(xiàn)代數(shù)據(jù)中心需求打造,適用于從高密度 AI 推理到橫向擴展的云原生工作負載。Graviton 已連續(xù)三年在亞馬遜云科技新增 CPU 算力部署中占比超半數(shù);如今,在 Amazon EC2 排名前 1000 的客戶中,已有 98% 在生產(chǎn)環(huán)境中采用 Graviton 系列處理器。
Graviton 也是亞馬遜云科技自研芯片戰(zhàn)略的關鍵一環(huán),在全新推出的 Amazon Trainium3 UltraServers 中,亞馬遜云科技三款定制芯片均部署于統(tǒng)一的計算底座中。在該架構設計中,基于 Arm 架構的 Amazon Graviton 和 Amazon Nitro 分別負責通用 CPU 計算及高性能網(wǎng)絡處理任務,為 Amazon Trainium3 UltraServers 提供核心技術支撐。
隨著 Arm 架構正逐步成為驅(qū)動 AI 時代核心平臺的算力基石,Graviton5 的推出成為行業(yè)變革的又一例證。
· Google Axion:搭載 Arm Neoverse 計算核心的 Axion 家族處理器現(xiàn)已提供更多的云實例配置項,為云和 AI 工作負載帶來前所未有的性能表現(xiàn)。
· Microsoft Cobalt 100 及全新發(fā)布的 Cobalt 200:這兩款處理器專為 Microsoft Azure 的 AI 優(yōu)化型數(shù)據(jù)中心的云原生工作負載打造,為微軟內(nèi)部服務及 Azure 客戶提供算力支持。
· NVIDIA Grace Blackwell:將 Arm 架構的 CPU 與 NVIDIA 的 AI 加速器相結合,打造出迄今最先進的 AI 計算平臺。
全球領先的超大規(guī)模云服務提供商、芯片制造商及系統(tǒng)集成商,早已跨越對定制化計算的探索期,正將其納入自身基礎設施戰(zhàn)略核心。Arm 平臺正是實現(xiàn)這一產(chǎn)業(yè)融合趨勢的可靠技術基石。
融合型 AI 數(shù)據(jù)中心的崛起
綜合來看,這些平臺共同彰顯了數(shù)據(jù)中心的快速演進。AI 正在打破基礎設施內(nèi)部的傳統(tǒng)邊界,將昔日由通用服務器與設備構成的松散架構,演變?yōu)橐惶赘叨日稀⒚嫦?AI 優(yōu)化的環(huán)境,實現(xiàn)計算、加速、網(wǎng)絡、內(nèi)存、存儲及軟件的協(xié)同設計與一體化運行。
在融合型 AI 數(shù)據(jù)中心中,性能和能效的提升來源于全棧協(xié)同,而非某個單一組件。Arm 提供連接全棧各層的通用架構,使云服務提供商在保持靈活性與效率的同時,能夠進行全局優(yōu)化,以滿足現(xiàn)代大規(guī)模工作負載的嚴苛要求。
系統(tǒng)各層級對 AI 性能的貢獻各不相同,而 Arm 架構貫穿始終:
· CPU 為 AI 系統(tǒng)提供控制平面,包括協(xié)調(diào)調(diào)度、數(shù)據(jù)遷移、內(nèi)存管理以及各類服務等,同時執(zhí)行關鍵模型邏輯,將詞元 (token) 轉(zhuǎn)化為有效操作。
· 加速器可在模型運算最密集處提供高密度算力,助力訓練與推理在數(shù)千個節(jié)點上實現(xiàn)高效規(guī)模化部署。
· 智能網(wǎng)卡 (SmartNIC)、DPU 及智能網(wǎng)絡存儲系統(tǒng)可卸載包括安全防護、網(wǎng)絡連接和數(shù)據(jù)訪問在內(nèi)的關鍵服務,并進行加速。不論是亞馬遜云科技的 Nitro、NVIDIA 的 BlueField,還是英特爾的 IPU,均可看出這些平臺正越來越多地采用Arm 架構芯片進行構建,確保數(shù)據(jù)在 AI 計算的每個環(huán)節(jié)之間安全高效地傳輸。
由此構建的基礎設施全面提升了每瓦智能 (intelligence-per-watt)——單位能耗下能夠輸出的有效 AI 算力——在保持軟件兼容性和生態(tài)系統(tǒng)一致性的前提下,進一步加速創(chuàng)新進程。得益于與亞馬遜云科技、Google Cloud、Microsoft Azure 和 NVIDIA 等合作伙伴的深度協(xié)作,基于 Arm 架構的定制化計算方案不僅勢頭漸勁,更進入了加速發(fā)展階段。
![]()
亞馬遜云科技公用計算高級副總裁 Peter DeSantis 出席 re:Invent 2025
Graviton5 與計算性能新拐點
Graviton5 配備 192 個核心,緩存容量較上一代提升五倍,針對亞馬遜云科技客戶的核心負載場景,可實現(xiàn)高達 25% 的性能躍升。這一提升既彰顯了定制化設計的變革性成效,同時也重新定義了云計算的經(jīng)濟效益。當性能增速超過功耗和成本的增幅時,行業(yè)格局便會被改寫,而 Arm 生態(tài)正引領這一關鍵轉(zhuǎn)折點的到來。
這一發(fā)展勢頭早已突破了超大規(guī)模云服務的應用范疇。如今,企業(yè)端正在將同樣的定制化設計原則應用于 AI 推理、自動駕駛、邊緣計算、智能網(wǎng)絡等多元化場景,而驅(qū)動這些應用場景的,正是同樣支撐著云服務的 Arm 架構。
展望未來:打造普惠的計算基石
在 Arm 平臺上共筑未來的,不止是全球企業(yè)巨頭。借助 Arm 全面設計 (Arm Total Design) 等生態(tài)項目,依托 Arm Neoverse 計算子系統(tǒng) (CSS) 平臺,Arm 正在賦能更廣泛的生態(tài)合作伙伴,以媲美超大規(guī)模云服務提供商的效率和速度來打造定制化芯片。同時,Arm 云遷移等項目也在為各種規(guī)模的企業(yè)降低 Arm 架構計算平臺的部署門檻,助力其充分釋放性能和能效優(yōu)勢。
隨著定制化計算逐步贏得市場認可,全行業(yè)正在積極擁抱這一趨勢。而 Arm 作為這一變革的核心計算平臺,正引領著未來的無限可能。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.