![]()
在2026 年國際消費電子展(CES)上,英偉達CEO黃仁勛發布了Vera Rubin AI 超算平臺,并推出推理上下文內存存儲(ICMS)—— 這一被視為AI存儲架構革新的方案,正為 NAND閃存與SSD開辟全新的AI推理應用場景。現場展示的獨立黑色存儲機架,標志著AI硬件從“算力優先”向“算力+存儲協同”的深刻轉變。
愛集微VIP頻道近日上線Citi Research發布的《英偉達推理上下文內存平臺,進一步加劇NAND短缺》。本報告深度解析了英偉達為Vera Rubin平臺引入的ICMS架構,并通過量化的需求模型預測:這項創新將為全球NAND閃存市場帶來結構性、大規模的增量需求,可能使本已緊張的供應短缺局面雪上加霜。
歡迎訂閱愛集微VIP頻道
核心洞察:一項架構革新如何重塑NAND市場
一、技術核心:用SSD解決AI推理的“內存墻”
英偉達為其Vera Rubin平臺搭載了基于BlueField-4芯片的推理上下文內存存儲(ICMS)架構,旨在解決大規模 AI 推理場景中普遍存在的內存瓶頸問題。該架構的核心創新在于:將AI推理過程中的關鍵鍵值緩存(KV Cache)從傳統高帶寬內存(HBM)中分流剝離,遷移至擴展性更強的專用存儲介質,擺脫對昂貴且容量受限的HBM的過度依賴。
這一設計可帶來三大性能提升:生成令牌速度最高提升5倍、能效最高提升5倍、延遲顯著降低,從而全面強化Vera Rubin平臺的AI推理算力。
為清晰闡釋ICMS的技術邏輯,報告首先明確了KV Cache的核心作用:作為Transformer 模型的關鍵內存優化機制,KV Cache 通過緩存已計算的鍵值對避免重復運算。按照內存層級,其可劃分為四類:
-GPU HBM(G1層級):承載活躍KV緩存;
-系統 DRAM(G2層級):承載過渡/溢出 KV 緩存;
-本地SSD(G3層級):承載溫/偏熱KV緩存;
-傳統共享企業存儲(G4層級):用于存儲冷 KV 緩存數據。
ICMS的核心突破,是在現有內存層級中新增一個G3.5層級。該層級以16TB TLC SSD 為存儲介質,可高效將海量、訪問頻率較低的冷KV緩存數據,轉化為計算單元可快速訪問的溫/熱數據,相當于在高速但容量有限的HBM與大容量但速度較慢的傳統企業存儲之間,搭建起一層高容量、中高帶寬的高速橋梁,從架構層面系統性緩解大模型推理的內存墻問題。
二、需求量化:單臺服務器需求超1PB,市場影響顯著
報告通過嚴謹的硬件規格推演,量化了ICMS帶來的NAND需求沖擊:
1.單臺服務器需求驚人
一臺完整的Vera Rubin服務器配備72塊GPU。根據架構,每塊GPU需對應16TB的SSD用于ICMS。因此,單臺服務器就需要額外搭載高達1152TB(即1.152PB)的NAND閃存。
2.全球需求占比可觀
保守情景:假設2026年Vera Rubin服務器出貨3萬臺,將新增3460萬TB的NAND需求,占2026年全球NAND總需求的2.8%。
積極情景:若2027年出貨量增至10萬臺,新增需求將躍升至1.152億TB,占2027年全球NAND總需求的9.3%。
對于一個產能擴張周期長(通常需18-24個月)、供需本就緊平衡的市場而言,如此集中且龐大的新增需求,無疑將顯著加劇供應短缺,并可能對價格產生強勁的向上支撐。
三、市場影響:核心NAND供應商直接受益
報告明確指出,ICMS架構的落地將成為NAND閃存核心供應商的重大利好。直接受益的企業包括全球市場的領導者:三星電子、SK海力士、西部數據(閃迪)、鎧俠、美光科技。
這些公司憑借其技術、產能與客戶關系,將率先承接來自英偉達及其服務器合作伙伴的訂單,其市場份額與盈利能力有望獲得提升。
產業前瞻:AI驅動存儲架構的范式轉移
報告揭示了一個超越短期市場波動的長期趨勢:AI推理工作負載正在重塑數據中心存儲層級。當模型參數和上下文長度不斷增長,KV Cache的大小可能達到TB甚至PB級,單純依賴HBM在成本和物理上都不再可行。
英偉達的ICMS架構標志著一個明確的轉向:通過軟件與系統架構創新,將海量、溫冷的數據存儲負擔向更高容量、更具成本效益的NAND閃存轉移。這不僅是為解決眼前的內存墻問題,更可能定義了未來AI服務器的標準存儲配置。
立即注冊愛集微VIP賬號
解鎖報告全部內容
愛集微VIP頻道:您的前沿技術雷達
在技術快速迭代、全球競爭格局瞬息萬變的時代,擁有系統、權威、前瞻的信息來源是做出正確決策的前提。愛集微VIP頻道致力于打造ICT產業的全球報告資源庫,通過“行業報告”“集微咨詢”“政策指引”三大板塊,為您提供:
-超過2萬份深度產業與技術研究報告,持續更新;
-每周新增數百篇前沿分析與技術解讀,緊扣脈搏;
-覆蓋技術演進、市場動態、產業鏈布局的多維信息體系。
我們堅持“信息普惠”原則,會員一次訂閱即可訪問全平臺內容,無二次收費,無分級限制。
限時會員通道現已開啟,為您的專業決策注入持續動能:
-首月體驗價僅需9.9元,以最低成本,超值體驗完整服務。
-月卡19.9元,靈活應對短期、高強度的信息需求。
-季卡54.9元,以穩定的節奏,持續把握產業脈搏。
-年卡199元,是長期主義者最具性價比的智囊伙伴。
立即注冊愛集微VIP賬號,一鍵獲取《英偉達推理上下文內存平臺,進一步加劇NAND短缺》完整報告,深入理解英偉達ICMS架構如何顛覆AI存儲體系,及其對全球NAND閃存市場供需與核心企業的深遠影響。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.