網易首頁 > 網易號 > 正文申請入駐

谷歌一個算法，內存跌成狗：AI真的不需要大內存了？

2026-04-06 06:00:06　來源: 商業簡讀

湖北舉報

分享至

家人們，誰能料到啊！壓垮內存價格的最后一根稻草，居然不是產能過剩，也不是需求暴跌，而是谷歌隨手發的一篇論文！

3月24號，谷歌研究院悄咪咪發布了一個叫TurboQuant的算法，就一句話，直接把萬億存儲市場炸懵了：AI大模型推理時的內存占用，直接砍到原來的1/6，速度還能提升8倍，關鍵是精度一點沒丟！

消息剛發酵24小時，全球存儲圈直接“塌房”——美光、三星、SK海力士三大巨頭市值蒸發超900億美元，股價集體暴跌；國內這邊更狠，DDR5內存直接開啟“自由落體”模式，16GB單條一天跌100塊，32GB套裝一周就跌了近30%，華強北的批發商哭暈在柜臺，吐槽說“囤了幾十萬的貨，幾周就虧沒一半，賣一根虧一根”。

資本市場慌了，現貨市場崩了，就連普通裝機黨都懵了：前陣子還被炒成“電子黃金”、搶都搶不到的內存，怎么突然就跌成“白菜價”了？難道AI時代的內存神話，真的要徹底破滅了？AI以后真的不需要大內存了？

今天就把這事講透，幫大家理清兩個關鍵問題：谷歌這個算法到底有多狠？AI真的要和大內存說再見了嗎？看完你就知道，這波暴跌背后，全是市場的“烏龍恐慌”！

先給大家用大白話講明白，TurboQuant到底是個啥——它不是什么玄乎的黑科技，就是精準掐住了AI最吃內存的“命門”：KV緩存。

咱們平時和AI聊天，比如問GPT、文心一言問題，AI得把咱們之前的對話、所有上下文都存在內存里，才能精準回應，不答非所問，這個用來存上下文的“臨時倉庫”，就是KV緩存。而且模型越大、聊得越久、同時用的人越多，這個“倉庫”就越占地方，最多能吃掉40%的內存，妥妥的內存“吞金獸”。

而谷歌這波操作，相當于直接把這個“倉庫”的東西壓縮了——把傳統需要16bit才能存儲的浮點數，硬生生壓縮到3.5bit，內存占用直接少了6倍，關鍵是不用重新訓練模型，也不用做任何校準，拿來就能用。在H100顯卡上實測，AI推理速度直接飆了8倍，不管是問答還是長文本生成，精度一點沒掉。

本來是個提升效率的好技術，結果被市場解讀成了“AI不需要內存了”——大家慌著想，既然內存占用能砍6倍，那之前囤的內存、廠家擴的產能，不就全成泡沫了？

恐慌一蔓延，就徹底失控了：股市里，存儲板塊迎來“黑色星期三”，美光跌了3.4%，SK海力士直接跌了6.23%，市值蒸發幾百億；現貨市場里，DDR5從之前的“一天一漲”變成“一天一跌”，高端型號一周就跌了500塊，甚至出現了“批發價比出廠價還低”的倒掛；渠道商更是瘋狂踩踏拋售，越跌越賣，越賣越跌，陷入了惡性循環。

短短一周時間，被炒上天的內存，直接從“香餑餑”變成了“燙手山芋”，跌得親媽都不認識了。但我必須說一句：這波暴跌，全是市場的誤讀！AI根本不是不需要內存了，而是內存的需求，徹底變了樣！

給大家劃3個關鍵邊界，看完你就明白，這波恐慌有多離譜：

第一，TurboQuant只優化“推理”，不碰“訓練”。咱們平時用AI聊天、生成內容，屬于“推理階段”，這部分確實能省內存；但訓練GPT-4、Llama 3這種大模型，需要PB級的內存，尤其是HBM高帶寬內存，這部分需求不僅沒減少，還在指數級暴漲。簡單說，就是“AI聊天省內存，但訓練AI更費內存”，根本不是不需要內存。

第二，它只壓縮KV緩存，不影響全量內存。剛才說過，KV緩存最多只占AI內存的40%，剩下的60%，比如模型參數、計算中間量、系統開銷，該多大還是多大。這就相當于，你把倉庫里的紙箱壓扁了，省了點空間，但倉庫本身還是要建，里面的貨物還是要運，內存的核心需求一點沒少。

第三，也是最關鍵的一點：效率提升≠需求減少，反而會刺激更多需求！這就是經濟學里的“杰文斯悖論”——技術讓使用成本降低，反而會讓更多人、更多場景用上它，總需求反而會變大。

以前跑一個大模型，可能需要1TB的內存，只有大企業、數據中心才玩得起；現在有了TurboQuant，16GB內存就能跑本地大模型，個人電腦、手機、邊緣設備都能用上AI。中小企業不用砸錢買昂貴的服務器，也能做AI應用；智能駕駛、智能家居、工業AI這些場景，也能快速落地。

雖然單臺設備用的內存少了，但架不住設備數量、AI場景、總調用次數暴增，全球內存的總需求，只會越來越高，而不是減少！

這波暴跌最魔幻的地方就在這：一邊是消費級DDR5跌成狗，一邊是AI專用的HBM（高帶寬內存）價格暴漲200%，行業已經徹底分化成了“兩極”。

咱們普通人接觸到的DDR5，主要用在PC、筆記本上，本來就因為國產長鑫放量、供給過剩，需求又萎縮，再加上這次算法恐慌，直接被打回原形；但AI服務器用的HBM，卻供不應求，價格瘋漲，產能被三大巨頭拉滿，單顆H100顯卡配的HBM成本就超1500美元，美光甚至預測，2028年HBM市場規模會突破千億美金，每年增長40%。

說白了，AI不是不需要內存，是不需要“普通內存”，真正能滿足AI需求的HBM，依然是“香餑餑”，只是消費級的DDR5，被市場的恐慌情緒和炒作泡沫，給帶崩了。

很多人最關心的問題來了：內存還會繼續跌嗎？現在入手劃算嗎？給大家說個實在話，分三個階段看，心里就有底了：

短期1-3個月：DDR5還會小幅下跌，但空間已經不大了。國產長鑫二期正在量產，成本比海外低15%-20%，價格戰還會繼續；而且渠道商的拋貨還沒結束，市場情緒還是偏弱，但現在價格已經接近成本線，想再暴跌，基本不可能了。

中期6-12個月：會慢慢筑底回暖，呈現“結構性分化”。2027年新的內存產能才會釋放，2026年整體還是偏緊；而且隨著AI推理全面落地，會帶動DDR5的需求溫和回升，而HBM會一直緊缺，成為存儲廠家的利潤核心。

長期3-5年：AI內存的超級周期，遠沒有結束。SK海力士、美光都預測，AI驅動的內存緊缺，會持續到2030年；以后的多模態大模型、MoE模型、智能體AI，對內存的帶寬和容量需求，只會越來越夸張。內存已經不再是簡單的“PC配件”，而是AI時代的“基礎設施”，未來市場規模會突破萬億美金。

最后，給咱們普通人提個醒：這波內存暴跌，對咱們來說，其實是好事！

如果你是裝機黨、想給老電腦升級，現在就是最佳窗口——16GB DDR5從之前的近千元，跌到現在的500-600元，32GB套裝也跌破了千元，花200塊給老電腦加條內存，流暢度直接翻倍，性價比拉滿。

但千萬別想著抄底炒貨賺錢，內存的周期已經變了，現在的下跌是擠泡沫，以后很難再靠囤貨投機賺大錢；自用、裝機，現在買不虧，非剛需的話，也可以再等1-2個月，等價格徹底筑底再入手。

總結一句話：谷歌的TurboQuant，不是內存的“終結者”，而是內存的“普及者”。它沒有殺死內存需求，只是讓內存的需求更精準——淘汰了冗余的浪費，讓AI走出數據中心，走進我們的日常生活。

這波暴跌，擠掉了炒作的泡沫，也讓我們看清了一個真相：內存的未來，不在囤貨投機里，而在AI真正落地的每一個場景里。

最后問大家一句：你最近有裝機、升級內存的計劃嗎？你覺得內存還會再跌嗎？歡迎在評論區留言討論，關注我，下次裝機不踩坑，帶你看清科技圈的那些烏龍和真相！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.