![]()
“全球半導(dǎo)體存儲器的市場規(guī)模預(yù)估將突破6000億美元。”
MemoryS 2026上,深圳市閃存市場資訊有限公司總經(jīng)理邰煒拋出這一數(shù)字,彰顯著存儲行業(yè)的底層邏輯已悄然改變:周期性行情退場,AI主導(dǎo)的新范式降臨。
引爆這場變革的,是AI推理對存儲的指數(shù)級需求:單請求情況下,若上下文從4K Token擴(kuò)展至128K Token,KV緩存會膨脹32倍,若是100個并發(fā)請求,緩存需求則達(dá)TB級。
面對這種需求量,HBM已無力承載,這就決定了KV緩存開始大規(guī)模向企業(yè)級SSD遷移。
疊加NL HDD產(chǎn)能缺口帶來的替代效應(yīng),多重變量共振,企業(yè)級SSD正在成為2026年NAND閃存最大的應(yīng)用市場。
“企業(yè)級SSD不再只是容量載體,而成了整個算力架構(gòu)里突破性能瓶頸的關(guān)鍵。”邰煒說到。
變局之下,AI對企業(yè)級SSD的標(biāo)準(zhǔn)無限拔高,高可靠性、低時延、高壽命既是定價標(biāo)尺,也是廠商廝殺的核心戰(zhàn)場。
誰能破解“AI時代數(shù)據(jù)搬運(yùn)的功耗與延遲”,誰就將定義下一個十年。
超級周期已啟幕,存儲廠商各有出招。
不做GPU的「配角」,SSD開始介入AI計算
當(dāng)AI推理規(guī)模化爆發(fā),存儲與計算的關(guān)系正在被重新定義:SSD不再只是數(shù)據(jù)的“倉庫”,而是影響Token生成效率的關(guān)鍵變量。
這種定位的躍遷,正在倒逼存儲廠商重新思考自身的技術(shù)縱深。
以大普微為例,為了實現(xiàn)更快的Token生成與響應(yīng),其通過Fast SSD與TLC SSD的產(chǎn)品組合,打造高IOPS和低時延的數(shù)據(jù)供給能力,從而節(jié)省算力和成本。
更深一層的變化在于,存儲開始介入計算的數(shù)據(jù)流調(diào)度。
大普微通過透明壓縮技術(shù)實現(xiàn)將KV Cache的數(shù)據(jù)無損壓縮21%以上,從而等效提升27%的帶寬,帶來直接的性能與用戶容量收益。
與此同時,F(xiàn)DP(靈活數(shù)據(jù)放置)技術(shù)的引入,讓SSD可以根據(jù)數(shù)據(jù)生命周期進(jìn)行分組管理,從而降低寫放大與延遲波動,為GPU提供可預(yù)期的數(shù)據(jù)供給節(jié)奏。
這些技術(shù)點的串聯(lián),勾勒出一個清晰的演進(jìn)方向:SSD正在從“存儲設(shè)備”進(jìn)化為“AI數(shù)據(jù)調(diào)度節(jié)點”,它不僅要存得快、存得多,還要存得“聰明”,能在正確的時間把正確的數(shù)據(jù)送到正確的位置。
更值得關(guān)注的是其產(chǎn)品節(jié)奏與AI算力迭代的同頻。
“目前,企業(yè)級SSD的市場大概能按照容量進(jìn)行劃分,4TB-32TB是TLC SSD的規(guī)模甜點,30TB以上則是QLC SSD的主力區(qū)間,大普微今年推出245TB的產(chǎn)品,明年就會設(shè)計為512TB。”大普微董事長楊亞飛對雷峰網(wǎng)表示。
這種“容量翻倍”的產(chǎn)品策略,與AI模型參數(shù)規(guī)模的增長曲線形成了共振,為下一階段產(chǎn)品的放量埋下基礎(chǔ)。
![]()
SSD的競爭核心是讓GPU「不空轉(zhuǎn)」
當(dāng)SSD開始承擔(dān)KV Cache卸載、AI數(shù)據(jù)湖、推理緩存等任務(wù),它既要提供接近內(nèi)存級的延遲穩(wěn)定性,又要具備遠(yuǎn)高于內(nèi)存的容量密度和成本優(yōu)勢。
在這種變化下,SSD的評價體系也隨之重構(gòu)。
過去行業(yè)更強(qiáng)調(diào)帶寬、IOPS與壽命,在AI場景中,長尾延遲控制、QoS一致性以及每瓦性能開始變得同樣關(guān)鍵。
對大型算力集群來說,一塊SSD的價值不只是單盤性能有多高,而在于它能否在復(fù)雜負(fù)載下保持穩(wěn)定響應(yīng),避免GPU因等待I/O而“空轉(zhuǎn)”。
也正是在這樣的背景下,企業(yè)級存儲廠商開始向系統(tǒng)能力延伸。
以憶恒創(chuàng)源為例,其核心策略并不是簡單堆疊硬件參數(shù),而是通過固件算法和系統(tǒng)級調(diào)度,把不同來源的控制器與NAND顆粒調(diào)校成更適合AI負(fù)載的產(chǎn)品形態(tài)。
在大規(guī)模線上部署中,依托國內(nèi)大規(guī)模、高度復(fù)雜的AI與互聯(lián)網(wǎng)生態(tài),在極端且高頻的業(yè)務(wù)壓力下,其SSD的平均無故障時間(MTBF)已經(jīng)達(dá)到約1500萬小時,產(chǎn)品的穩(wěn)定性有可觀的場景及數(shù)據(jù)背書。
在AI負(fù)載環(huán)境下,通過固件調(diào)度優(yōu)化和延遲控制,其隨機(jī)讀延遲可以壓縮至50微秒級,從而減少推理場景中GPU等待I/O的時間。
并且,通過對固件和硬件架構(gòu)的協(xié)同優(yōu)化,高密度QLC在AI數(shù)據(jù)湖和推理場景中既能提供更大的容量密度,也能維持穩(wěn)定的性能表現(xiàn)。
對于需要存儲海量訓(xùn)練數(shù)據(jù)或推理緩存的集群而言,這類產(chǎn)品正在成為實現(xiàn)“全閃數(shù)據(jù)中心”的關(guān)鍵一步。
![]()
AI重構(gòu)存儲路徑:企業(yè)級SSD從「容量介質(zhì)」轉(zhuǎn)向「算力系統(tǒng)變量」
在這一輪由 AI 推動的存儲重構(gòu)中,一個更清晰的共識正在形成:企業(yè)級SSD的價值錨點,正在從“單點性能指標(biāo)”轉(zhuǎn)向“系統(tǒng)確定性”。
無論是KV Cache大規(guī)模卸載帶來的架構(gòu)遷移,還是QLC在高密度存儲中的重新定位,抑或是固件層對延遲、QoS 與功耗的持續(xù)壓縮,本質(zhì)上都在指向同一個問題:存儲不再只是容量與帶寬的提供者,而是決定算力是否能夠被穩(wěn)定釋放的基礎(chǔ)變量。
在這個意義上,行業(yè)的競爭邊界也在悄然上移。
單一硬件能力的差異正在被系統(tǒng)級能力所稀釋,真正拉開差距的,是誰能更早理解AI工作負(fù)載的變化,并將其轉(zhuǎn)化為可規(guī)模化、可持續(xù)優(yōu)化的工程體系。
當(dāng)算力、存儲與網(wǎng)絡(luò)進(jìn)一步融合,數(shù)據(jù)中心的邏輯也將從“資源堆疊”走向“效率組織”。
而存儲,正站在這一輪重構(gòu)的交匯點上。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.