網易首頁 > 網易號 > 正文申請入駐

谷歌論文炸場！AI內存砍6倍，存儲巨頭股價集體跳水

2026-03-26 14:28:04　來源: 魏家東

北京舉報

分享至

2026年3月25日，美股開盤即上演“黑色星期三”——存儲芯片板塊集體重挫，美光、西部數據、希捷、閃迪等巨頭股價全線飄綠，最大跌幅超6%。這場突如其來的市場震蕩，導火索并非芯片產能、需求數據等傳統因素，而是谷歌一篇尚未正式發表的論文：TurboQuant。

這篇即將亮相ICLR2026的技術成果，用一套“暴力”壓縮方案，將大模型推理的核心瓶頸——KV緩存，在幾乎零精度損耗的前提下壓縮至3-bit，內存開銷驟降6倍，推理速度飆升8倍。消息一出，市場瞬間炸鍋：AI服務器的“內存剛需”邏輯被直接動搖，萬億存儲芯片市場的底層邏輯遭遇前所未有的沖擊。

一、KV緩存：大模型的“內存吞金獸”

要理解TurboQuant的顛覆性，得先搞懂它瞄準的靶心——KV緩存到底有多“吃內存”。

大模型生成每一個新Token時，都要“回看”之前所有對話內容，避免重復計算。為了提速，模型會把每一層注意力機制生成的Key（鍵）和Value（值）向量全部緩存起來，形成一張高速“速查表”，這就是KV緩存。

問題在于，這張表會隨對話長度線性膨脹：

上下文從4K擴展到128K，甚至百萬級別時，KV緩存占用的顯存往往反超模型參數本身，成為推理階段最大的內存瓶頸。

傳統量化方案（如16-bit轉4-bit）雖能壓縮，但需額外存儲歸一化參數，每塊數據多占1-2bit，實際壓縮效果大打折扣。

簡單說，KV緩存就是大模型的“短期記憶”，越長對話越占內存，直接決定了AI服務器的硬件門檻和推理成本。過去兩年，AI大模型的爆發式增長，讓“高帶寬、大容量內存”成了存儲芯片廠商的核心增長邏輯，美光、SK海力士等企業的估值，幾乎都建立在“AI單機內存需求只增不減”的預期之上。

二、TurboQuant：用數學暴力破解內存瓶頸

谷歌TurboQuant的厲害之處，在于它用一套極簡的數學方案，徹底解決了傳統壓縮的“附加開銷”問題，實現了近乎無損的極致壓縮。

1.兩步“絕殺”：極坐標+1-bit校正

TurboQuant的核心是兩階段壓縮流程，沒有復雜的模型重訓，全靠數學變換：

第一步：PolarQuant極坐標變換

傳統量化在笛卡爾坐標系下操作，需額外存儲“比例尺”（歸一化參數），占內存。TurboQuant先對高維向量做隨機旋轉，再切換到極坐標系描述——旋轉后向量分量收斂到統一分布，無需存儲任何歸一化常數，直接把這部分內存開銷“歸零”。

第二步：1-bit誤差校正

壓縮必然帶來偏差，TurboQuant僅用1-bit額外空間，加入數學“校正器”，精準抹平系統性誤差，確保模型推理表現幾乎零損耗。

2.實戰效果：碾壓傳統方案，性能拉滿

谷歌在LongBench、NeedleInAHaystack等五大長上下文基準測試中，對Gemma、Mistral、Llama-3.1-8B等模型做了嚴格驗證，結果堪稱“暴力”：

壓縮能力：3-bit配置下，KV緩存開銷直接降6倍，2.5-bit也能實現4.9倍壓縮，且精度逼近全精度模型。

速度提升：在H100GPU上，4-bitTurboQuant的注意力計算速度，比32-bit基線快8倍，且運行時開銷幾乎可忽略。

極限測試：“大海撈針”任務中，6倍壓縮后，模型在10萬Token文本里精準檢索信息，與全精度版本完全一致。

更關鍵的是，論文發布不到24小時，獨立開發者就基于PyTorch和Tritonkernel完成復現——在RTX4090上用2-bit跑Gemma34B，輸出與未壓縮版本逐字符相同，用代碼驗證了“零損耗”的真實性。

三、市場震蕩：存儲巨頭的“底層邏輯地震”

TurboQuant的出現，對存儲芯片行業而言，是一場不折不扣的底層邏輯大地震。

1.直接沖擊：AI硬件邏輯被改寫

過去兩年，存儲廠商的估值核心是“AI服務器單機容量紅利”——大模型越長、越復雜，需要的高端內存就越多，“量價齊升”成了行業共識。

但TurboQuant直接打破了這個邏輯：

同樣的內存，能跑更長上下文、更多并發、更大模型；

每臺服務器所需的高端內存芯片，理論上可能大幅減少；

推理成本的“地板價”被直接改寫，3-bit能做過去16-bit的事。

這也是為什么消息一出，美股存儲板塊瞬間崩盤——市場開始重新評估：如果AI內存需求能靠軟件算法“砍半”，那些押注硬件剛需的資金，自然要緊急避險。CloudflareCEO甚至將其形容為“谷歌的DeepSeek時刻”，直指這項技術徹底動搖了“高內存=高性能”的行業迷信。

2.行業連鎖反應：從實驗室到產業的沖擊波

TurboQuant的影響遠不止股價：

對AI公司：推理成本大幅下降，端側部署門檻降低——16GBMacmini都能跑大模型，中小團隊也能低成本落地AI服務。

對存儲廠商：壓力陡增。過去靠“堆容量”賺錢的模式受到挑戰，必須轉向更高帶寬、更低功耗、更適配AI算法的產品創新，否則將被淘汰。

對技術生態：核心思想開源后，全行業都能跟進優化，KV緩存壓縮將從“實驗室技術”快速走向規模化落地，重塑AI算力的成本結構。

四、天沒塌：杰文斯悖論下的行業新邏輯

很多人驚呼“存儲芯片的天塌了”，但真相是：天沒塌，只是邏輯變了。

科技行業有一條反復驗證的鐵律——杰文斯悖論：資源使用效率越高，總消耗量反而越大。就像蒸汽機效率提升后，英國煤炭消耗量不降反增；AI算力效率年增30%，但數據中心耗電卻持續飆升。

放到TurboQuant身上，邏輯同樣成立：

內存壓縮6倍，不是“少買內存”，而是用同樣內存做更多事——更長上下文、更多并發、更大模型，最終推動AI應用更廣泛落地，反而刺激總內存需求增長。

目前TurboQuant僅在8B參數模型上驗證，70B以上大模型、MoE架構、百萬級上下文的表現尚未證實，距離大規模商用仍有距離。

存儲行業正處于供應極度緊張階段，短期需求不會因一項技術而驟降，股價下跌更多是市場情緒的“獲利了結”。

五、算力競賽的新戰場：數學比芯片更鋒利

TurboQuant事件，給整個科技行業上了一課：在算力軍備競賽里，最鋒利的武器未必是更大的芯片，而是更聰明的數學。

過去幾年，行業陷入“堆硬件”的誤區——大模型越大、顯存越高、算力越強，就越有競爭力。但TurboQuant證明，軟件算法的優化，能直接撬動硬件的效率天花板，用更低成本實現同等甚至更好的性能。

未來，AI行業的競爭將從“單純拼硬件”，轉向硬件+算法的協同創新：

芯片廠商需要設計更適配壓縮算法、稀疏計算的硬件；

算法團隊需要持續突破內存、算力的效率邊界；

整個行業將在“降本增效”的驅動下，走向更健康、更普惠的發展路徑。

谷歌一篇論文引發的存儲地震，本質是AI行業從“野蠻生長”走向“精耕細作”的縮影。TurboQuant沒有摧毀存儲市場，而是重塑了市場的底層邏輯——效率優先、算法驅動、普惠落地，將成為AI算力發展的新主線。

對存儲廠商而言，這是挑戰，更是機遇；對整個行業而言，這是一次關鍵的“糾偏”——真正的AI革命，從來不是堆硬件，而是用技術讓算力更高效、更普惠。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

1000 倍效率神話，Taalas如何用 “模型即芯片” 暴打英偉達

鈦媒體APP 2026-02-24 15:35:10
0 跟貼 0
Generalist爆火背后：具身智能真正的競爭，已不在模型

機器之心Pro 2026-04-10 18:34:51
0 跟貼 0

神秘新王“歡樂馬”，原來是阿里ATH大模型新副本首秀

智東西 2026-04-11 00:17:44
0 跟貼 0

CVPR 2026 | 20步也能穩住畫質，這個擴散加速方法不一樣

機器之心Pro 2026-04-10 18:40:17
0 跟貼 0
龍蝦連Gemma 4，只需三步，谷歌官方教程出爐，不再花錢買token

機器之心Pro 2026-04-10 18:36:11
8 跟貼 8

比黃金還貴的腦起搏器，這一撕就是20萬，真正的保命用！

冥想搞笑 2026-04-09 16:31:19
1 跟貼 1

在美華人：中國彎道超車別做夢了！美國的先進你無法想象！

豎笛小魔王 2026-04-07 02:28:20
17 跟貼 17
索尼PS6價格曝光！全球局勢或將其推向1000美元

游民星空 2026-04-10 21:21:32
1 跟貼 1

三個浙大校友，沖刺“AR眼鏡第一股”

財天COVER 2026-04-10 19:00:05
0 跟貼 0
美股芯片股多數上漲

財聯社 2026-04-10 21:46:10
0 跟貼 0
CPO商用化提速：Scale-out突破0到1，Scale-up有望率先大規模落地？

華爾街見聞官方 2026-04-10 18:09:13
0 跟貼 0
警報拉響，車用芯片國產率僅25%，華為第一，該有危機感了

王新喜 2026-04-10 20:49:15
0 跟貼 0
存儲芯片漲價后，5000元的iPhone都要擴容了：大容量買不起

雷科技 2026-04-09 09:57:44
1 跟貼 1
男子把麻將牌砸碎，從里頭找出了一塊芯片

銳眼新聞 2026-04-09 15:33:29
0 跟貼 0
硅基直覺的誕生：大模型如何一瞥見全體

尹燁 2026-04-08 21:40:58
0 跟貼 0
他們全員6點下班，卻讓硅谷脊背發涼

獸樓處 2026-04-06 17:12:07
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
一顆藥下肚就能自動報備，醫學界迎來新突破

Maxonor創意公元 2026-04-06 17:17:24
0 跟貼 0
媒體：中方一直擔憂美印在中東使壞 20年前就開始布局了

澎湃新聞 2026-04-10 07:12:09
8214 跟貼 8214
韓國政府3招硬剛內存漲價：2.2萬臺電腦不扔了

灰度測試中 2026-04-10 09:25:37
0 跟貼 0
11天押注230億，動力電池更賺錢，億緯鋰能為什么偏要去卷儲能

鈦媒體APP 2026-04-10 15:42:19
0 跟貼 0
夢幻第六十三次服務器合并？連紫禁之巔都合區了？基本都三合一？

夢幻天真 2026-04-08 12:57:28
0 跟貼 0
PS6成本再曝光！價格預測最壞情況:接近1000美元

游民星空 2026-04-10 21:21:32
1 跟貼 1
《影之刃零》進入最后開發階段；《心跳文學部》遭谷歌商店下架

BB姬 2026-04-10 22:05:33
0 跟貼 0
QVGen讓「超低比特視頻生成量化」真正可用！

機器之心Pro 2026-02-25 18:07:24
0 跟貼 0
姑娘大街上直播跳舞，硬件條件太差了，想復制阿梓的路不可能

矜寡愛時尚 2026-04-06 09:17:05
0 跟貼 0
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
帥化民犀利發聲：美國竟忘了大陸搞北斗的初衷

精彩不容錯過 2026-04-10 22:41:17
0 跟貼 0
首批穩定幣牌照今日公布，兩家機構獲批

財聯社 2026-04-10 18:24:07
42 跟貼 42
一夜刷屏的SBTI，給營銷人上了什么課？

鈦媒體APP 2026-04-10 15:52:15
0 跟貼 0
華為暢享90m Plus正式亮相，麒麟8000芯片

快科技 2026-04-10 04:59:04
0 跟貼 0
奇瑞“雙虎耀全球”三車齊發，油電同智7萬級也有8155芯片

座駕 2026-04-08 22:29:47
0 跟貼 0
高手之間的對決，差距往往藏在細節，關鍵竟差在了硬件上

菠菜不算愛 2026-04-08 14:22:49
1 跟貼 1
日本“降級”中日關系中方表態

參考消息 2026-04-10 14:22:31
98 跟貼 98
缸中之腦現代版：20萬人腦神經元一周學會打Doom

量子位 2026-03-06 17:34:11
0 跟貼 0
美國推演：7天打掉4萬解放軍？參數一扒就露餡

半路友人之他 2026-04-10 02:11:31
1 跟貼 1
53條中日航線3月取消全部航班

第一財經 2026-04-10 12:52:58
7169 跟貼 7169
“祖先給的特權”，河南網友稱祖墳在景區祭祖免票，景區回應：沒過檢票口，一般是附近住戶的祖墳

大風新聞 2026-04-06 15:06:12
3913 跟貼 3913
東華軟件：公司在智能化應用、智算、服務器與硬件體系及大模型一體機四大方向開展合作

每日經濟新聞 2026-04-10 16:44:32
0 跟貼 0
400年前的機械大腦？沒電沒芯片，它憑什么自動控制機器？

一棵不倒松 2026-04-07 16:19:03
5 跟貼 5

魏家東

一個人的營銷商學院！

2624文章數 12232關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

房產

時尚

家居

公開課

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
13個毀掉你生活的不良習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

谷歌論文炸場！AI內存砍6倍，存儲巨頭股價集體跳水

馬斯克狂發大火箭也養不起AI 年虧50億美元

73歲騎友抄近路摔倒身亡 女兒：賠償問題無法達成共識

73歲騎友抄近路摔倒身亡 女兒：賠償問題無法達成共識

17歲賺了一百萬美元，25歲被CBA裁員

黃景瑜王玉雯否認戀情！聚會細節被扒

李強主持召開經濟形勢專家和企業家座談會

搭載第二代刀片電池及閃充技術 騰勢N8L閃充版預售35萬起

態度原創

12噸巧克力有難，全網化身超級偵探添亂

28條新規落地！好房子，終于有了“廣州標準”！

今日熱點：陳添祥長文道歉；夏克立曾給前經紀人傳上廁所照片……

復古風格 自然簡約

73歲騎友抄近路摔倒身亡女兒：賠償問題無法達成共識

73歲騎友抄近路摔倒身亡女兒：賠償問題無法達成共識

搭載第二代刀片電池及閃充技術騰勢N8L閃充版預售35萬起

復古風格自然簡約