《科創板日報》1月7日訊 從美股到A股,今日全球存儲概念股集體暴漲。美股閃迪大漲27%,西部數據漲超16%,美光漲10%,A股恒坤新材20CM漲停,安集科技、長川科技、普冉股份、聚辰股份大幅走強。
在這背后,黃仁勛在CES發布的演講和新品,再次推高了本就火熱的存儲行情。
他表示,存儲“目前仍是一個完全未被開發的市場”。AI驅動的存儲需求已經超過了現有基礎設施的容量。“我們現在處理的上下文內存、token內存和KV緩存的數量都太大了,舊的存儲系統根本無法滿足需求。”
“AI正在重塑整個計算棧——而現在,也包括存儲。AI不再是一次性問答的聊天機器人,而是能夠理解物理世界、進行長周期推理、保持事實一致性、調用工具完成真實工作的智能協作者,并具備短期與長期記憶能力。”
之后他宣布英偉達將推出由BlueField-4 驅動新一代AI原生儲存基礎架構,重構面向下一階段AI的存儲架構,并用“革命性”一詞來形容這一項創新。
▌新存儲平臺是什么?
英偉達的存儲新平臺全稱為NVIDIA Inference Context Memory Storage Platform(英偉達推理情境內存存儲平臺)。
據官方介紹,該平臺通過擴展GPU可用內存容量,為上下文記憶提供基礎設施支持,實現跨節點的高速共享。
從架構上來說,這個平臺實際上是為了AI推理專門打造了一層高速、低能耗的“上下文記憶”存儲層,將原本只能放在昂貴且有限的GPU HBM的KV cache(KV緩存)擴展到NVMe 閃存和跨機群共享。
與傳統存儲方案相比,其可將每秒可處理的token數提升最高5倍,并實現最高5倍的能效優化。
▌有何突出?
本次英偉達的新平臺是首次將AI推理KV緩存當成獨立基礎設施層來設計。
在此之前,一般KV緩存有三個路徑選擇:GPU的HBM(快,但貴且容量極小)、 CPU內存(稍慢且規模有限)、SSD/存儲(便宜但延遲不可控)。
黃仁勛在CES的演講中,用“革命性的”來形容這一項創新。
他指出,這本質上是在機架內直接加入一個極快的KV緩存上下文存儲系統。整個行業之所以如此興奮,是因為對于當今所有進行大規模Token生成的機構企業而言,KV緩存都是一個痛點。“所以,我們要創建一個新平臺、一個新處理器來運行整個Dynamo KV緩存上下文內存管理系統,并將其放置在離機架其余部分非常近的地方,這個想法是完全革命性的。”
▌AI推理瓶頸轉向上下文存儲
在新平臺的介紹中,“KV緩存”一詞頻繁出現,一定程度上來說,這也是促使英偉達開發新平臺的關鍵原因之一。
黃仁勛在最新的CES演講中強調,AI推理瓶頸正從計算轉向上下文存儲。隨著模型規模提升以及用戶使用量的提升,AI處理需要多輪對話、多步推理的復雜任務時會產生大量上下文數據。而傳統網絡存儲對短期上下文而言效率過低,AI存儲架構需要重構。
這種海量的上下文數據通常以KV緩存的形式存在,對推理準確性、用戶體驗以及交互連續性——即備受追捧的“個性化AI”能力至關重要。
“推理時代”下,KV緩存顯存占用隨Token數量線性增長,同時KV Cache的優化效果也與文本長度正相關。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.