家人們,誰能料到啊!壓垮內存價格的最后一根稻草,居然不是產能過剩,也不是需求暴跌,而是谷歌隨手發的一篇論文!
3月24號,谷歌研究院悄咪咪發布了一個叫TurboQuant的算法,就一句話,直接把萬億存儲市場炸懵了:AI大模型推理時的內存占用,直接砍到原來的1/6,速度還能提升8倍,關鍵是精度一點沒丟!
![]()
消息剛發酵24小時,全球存儲圈直接“塌房”——美光、三星、SK海力士三大巨頭市值蒸發超900億美元,股價集體暴跌;國內這邊更狠,DDR5內存直接開啟“自由落體”模式,16GB單條一天跌100塊,32GB套裝一周就跌了近30%,華強北的批發商哭暈在柜臺,吐槽說“囤了幾十萬的貨,幾周就虧沒一半,賣一根虧一根”。
資本市場慌了,現貨市場崩了,就連普通裝機黨都懵了:前陣子還被炒成“電子黃金”、搶都搶不到的內存,怎么突然就跌成“白菜價”了?難道AI時代的內存神話,真的要徹底破滅了?AI以后真的不需要大內存了?
今天就把這事講透,幫大家理清兩個關鍵問題:谷歌這個算法到底有多狠?AI真的要和大內存說再見了嗎?看完你就知道,這波暴跌背后,全是市場的“烏龍恐慌”!
先給大家用大白話講明白,TurboQuant到底是個啥——它不是什么玄乎的黑科技,就是精準掐住了AI最吃內存的“命門”:KV緩存。
咱們平時和AI聊天,比如問GPT、文心一言問題,AI得把咱們之前的對話、所有上下文都存在內存里,才能精準回應,不答非所問,這個用來存上下文的“臨時倉庫”,就是KV緩存。而且模型越大、聊得越久、同時用的人越多,這個“倉庫”就越占地方,最多能吃掉40%的內存,妥妥的內存“吞金獸”。
而谷歌這波操作,相當于直接把這個“倉庫”的東西壓縮了——把傳統需要16bit才能存儲的浮點數,硬生生壓縮到3.5bit,內存占用直接少了6倍,關鍵是不用重新訓練模型,也不用做任何校準,拿來就能用。在H100顯卡上實測,AI推理速度直接飆了8倍,不管是問答還是長文本生成,精度一點沒掉。
本來是個提升效率的好技術,結果被市場解讀成了“AI不需要內存了”——大家慌著想,既然內存占用能砍6倍,那之前囤的內存、廠家擴的產能,不就全成泡沫了?
![]()
恐慌一蔓延,就徹底失控了:股市里,存儲板塊迎來“黑色星期三”,美光跌了3.4%,SK海力士直接跌了6.23%,市值蒸發幾百億;現貨市場里,DDR5從之前的“一天一漲”變成“一天一跌”,高端型號一周就跌了500塊,甚至出現了“批發價比出廠價還低”的倒掛;渠道商更是瘋狂踩踏拋售,越跌越賣,越賣越跌,陷入了惡性循環。
短短一周時間,被炒上天的內存,直接從“香餑餑”變成了“燙手山芋”,跌得親媽都不認識了。但我必須說一句:這波暴跌,全是市場的誤讀!AI根本不是不需要內存了,而是內存的需求,徹底變了樣!
給大家劃3個關鍵邊界,看完你就明白,這波恐慌有多離譜:
第一,TurboQuant只優化“推理”,不碰“訓練”。咱們平時用AI聊天、生成內容,屬于“推理階段”,這部分確實能省內存;但訓練GPT-4、Llama 3這種大模型,需要PB級的內存,尤其是HBM高帶寬內存,這部分需求不僅沒減少,還在指數級暴漲。簡單說,就是“AI聊天省內存,但訓練AI更費內存”,根本不是不需要內存。
第二,它只壓縮KV緩存,不影響全量內存。剛才說過,KV緩存最多只占AI內存的40%,剩下的60%,比如模型參數、計算中間量、系統開銷,該多大還是多大。這就相當于,你把倉庫里的紙箱壓扁了,省了點空間,但倉庫本身還是要建,里面的貨物還是要運,內存的核心需求一點沒少。
第三,也是最關鍵的一點:效率提升≠需求減少,反而會刺激更多需求!這就是經濟學里的“杰文斯悖論”——技術讓使用成本降低,反而會讓更多人、更多場景用上它,總需求反而會變大。
以前跑一個大模型,可能需要1TB的內存,只有大企業、數據中心才玩得起;現在有了TurboQuant,16GB內存就能跑本地大模型,個人電腦、手機、邊緣設備都能用上AI。中小企業不用砸錢買昂貴的服務器,也能做AI應用;智能駕駛、智能家居、工業AI這些場景,也能快速落地。
雖然單臺設備用的內存少了,但架不住設備數量、AI場景、總調用次數暴增,全球內存的總需求,只會越來越高,而不是減少!
這波暴跌最魔幻的地方就在這:一邊是消費級DDR5跌成狗,一邊是AI專用的HBM(高帶寬內存)價格暴漲200%,行業已經徹底分化成了“兩極”。
咱們普通人接觸到的DDR5,主要用在PC、筆記本上,本來就因為國產長鑫放量、供給過剩,需求又萎縮,再加上這次算法恐慌,直接被打回原形;但AI服務器用的HBM,卻供不應求,價格瘋漲,產能被三大巨頭拉滿,單顆H100顯卡配的HBM成本就超1500美元,美光甚至預測,2028年HBM市場規模會突破千億美金,每年增長40%。
說白了,AI不是不需要內存,是不需要“普通內存”,真正能滿足AI需求的HBM,依然是“香餑餑”,只是消費級的DDR5,被市場的恐慌情緒和炒作泡沫,給帶崩了。
![]()
很多人最關心的問題來了:內存還會繼續跌嗎?現在入手劃算嗎?給大家說個實在話,分三個階段看,心里就有底了:
短期1-3個月:DDR5還會小幅下跌,但空間已經不大了。國產長鑫二期正在量產,成本比海外低15%-20%,價格戰還會繼續;而且渠道商的拋貨還沒結束,市場情緒還是偏弱,但現在價格已經接近成本線,想再暴跌,基本不可能了。
中期6-12個月:會慢慢筑底回暖,呈現“結構性分化”。2027年新的內存產能才會釋放,2026年整體還是偏緊;而且隨著AI推理全面落地,會帶動DDR5的需求溫和回升,而HBM會一直緊缺,成為存儲廠家的利潤核心。
長期3-5年:AI內存的超級周期,遠沒有結束。SK海力士、美光都預測,AI驅動的內存緊缺,會持續到2030年;以后的多模態大模型、MoE模型、智能體AI,對內存的帶寬和容量需求,只會越來越夸張。內存已經不再是簡單的“PC配件”,而是AI時代的“基礎設施”,未來市場規模會突破萬億美金。
最后,給咱們普通人提個醒:這波內存暴跌,對咱們來說,其實是好事!
如果你是裝機黨、想給老電腦升級,現在就是最佳窗口——16GB DDR5從之前的近千元,跌到現在的500-600元,32GB套裝也跌破了千元,花200塊給老電腦加條內存,流暢度直接翻倍,性價比拉滿。
但千萬別想著抄底炒貨賺錢,內存的周期已經變了,現在的下跌是擠泡沫,以后很難再靠囤貨投機賺大錢;自用、裝機,現在買不虧,非剛需的話,也可以再等1-2個月,等價格徹底筑底再入手。
總結一句話:谷歌的TurboQuant,不是內存的“終結者”,而是內存的“普及者”。它沒有殺死內存需求,只是讓內存的需求更精準——淘汰了冗余的浪費,讓AI走出數據中心,走進我們的日常生活。
這波暴跌,擠掉了炒作的泡沫,也讓我們看清了一個真相:內存的未來,不在囤貨投機里,而在AI真正落地的每一個場景里。
最后問大家一句:你最近有裝機、升級內存的計劃嗎?你覺得內存還會再跌嗎?歡迎在評論區留言討論,關注我,下次裝機不踩坑,帶你看清科技圈的那些烏龍和真相!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.