![]()
![]()
出品|搜狐科技
作者|張雅婷
編輯| 楊 錦
存儲市場的高歌猛進,被谷歌投下的一枚“深水炸彈”驟然打斷。
當地時間3月24日,谷歌研究院發表文章推出以TurboQuant為代表的新一代壓縮算法,宣稱可以在不損失質量的前提下實現AI內存的極致壓縮,突破了AI發展的核心瓶頸。
隨著大模型參數規模邁向萬億級別,推理過程中鍵值緩存帶來的內存壓力暴漲。每一次問答、每一次推理,都需要海量內存資源支撐。
OpenAI首席運營官Brad Lightcap此前表示,存儲芯片短缺與美國能源供應緊張,是當前AI基礎設施擴張面臨的兩大潛在瓶頸。“現在的瓶頸是存儲,過去是電力。”
而谷歌最新推出的 TurboQuant 技術,在幾乎不影響模型性能的情況下,可將鍵值緩存壓縮至原來的1/6(約減少 83%),從而顯著緩解內存壓力;同時,在英偉達 H100 GPU 上,其性能最高可提升至8倍。
Cloudflare首席執行官Matthew Prince認為,谷歌TurboQuant有望像去年的DeepSeek模型一樣,通過效率革新打破算力依賴的行業邏輯。
這枚“深水炸彈”掀起的沖擊波,迅速傳導至資本市場。存儲巨頭股價集體重挫,恐慌情緒蔓延。美東時間3月26日,閃迪(SanDisk)股價大跌11.02%,美光科技下跌6.97%。
![]()
谷歌發布突破性新算法
當地時間3月24日,谷歌發布了名為TurboQuant的技術,引發市場震動。
根據谷歌官方介紹,TurboQuant是一種專為大型語言模型和向量搜索引擎設計的內存壓縮技術,核心目標是解決AI系統中鍵值緩存(Key-Value Cache)的存儲瓶頸。
所謂鍵值緩存,可以簡單理解為模型在“做閱讀理解時做的筆記”。當大模型逐字生成內容時,會把已經處理過的信息存下來,下次就不用從頭再算一遍,從而加快生成速度。不過,這些“筆記”會隨著對話變長不斷累積,占用越來越多的內存,最終可能成為推理過程中的主要資源消耗。
向量量化(Vector Quantization)是一種強大的經典數據壓縮技術。然而,這種傳統的向量量化方法讓每個數字產生1至2比特的額外內存開銷,部分抵消了壓縮收益。
而谷歌提出的TurboQuant,可以在實現模型尺寸大幅縮減的同時保持零精度損失。
具體來看,TurboQuant可在無需模型訓練或微調的前提下,將鍵值緩存壓縮至3比特,在Gemma、Mistral等開源模型實測中,鍵值內存降至1/6(約減少 83%)。在英偉達H100 GPU加速器上,該算法較未量化鍵值方案性能提升最高達8倍。
TurboQuant通過兩個關鍵步驟實現壓縮:首先是采用PolarQuant(高質量壓縮)方法,對數據向量進行隨機旋轉。這一巧妙的步驟簡化了數據的幾何結構,實現高質量壓縮。
然后,TurboQuant使用極少量的殘余壓縮能力,利用量化Johnson-Lindenstrauss算法充當數學誤差校驗器,處理第一階段留下的微量誤差,從而獲得更準確的注意力分數。
谷歌表示,TurboQuant、QJL和PolarQuant雖然主要應用是解決Gemini等模型中的KV緩存瓶頸,但其影響遠不止于此。
當下,搜索正從單純的關鍵詞匹配演變為理解意圖和含義,TurboQuant等技術對于這一使命至關重要。因為它們允許以極小的內存、接近零的預處理時間和業界領先的準確性,來構建和查詢大型向量索引,這使得語義搜索變得更快、更高效。
據了解,TurboQuant將于ICLR 2026發表,PolarQuant則計劃在AISTATS 2026上亮相。谷歌已在LongBench、Needle In A Haystack、ZeroSCROLLS、RULER及L-Eval等多項基準測試中完成驗證,并指出該技術同樣適用于大規模搜索引擎的向量檢索場景。
![]()
內存股集體大跌
存儲的“DeepSeek時刻”來了?
谷歌TurboQuant技術發布后,全球存儲芯片板塊震蕩。
美東時間3月26日,閃迪股價大跌11.02%,美光科技下跌6.97%,西部數據下跌7.7%,希捷科技下跌8.33%。
韓國存儲巨頭同樣受到重創。當地時間3月26日,韓國SK海力士股價下跌6.23%,市值損失44.18萬億韓元(約合293.8億美元);三星電子也下跌了4.71%,市值損失57.83萬億韓元(約合384.5億美元)。3月27日,三星電子和海力士股價仍持續下跌,跌幅收窄至1%左右。
今日開盤,A股存儲芯片集體大跌,佰維存儲、西測測試跌超7%,江波龍、德明利、香農芯創跌超5%。
近兩年,由于AI產業的爆發,存儲需求隨之暴漲。
以HBM(高帶寬內存)為例,這一基于DRAM技術的高端品類,主要面向AI時代高性能計算場景。數據顯示,2025年,AI服務器對HBM的需求量從2024年的30萬顆激增至120萬顆,增長率高達300%。
三星電子表示,目前所有可量產的HBM產能均已預訂滿,預計2026年HBM銷量將同比增長超過三倍。
然而,谷歌TurboQuant技術的出現,悄然改寫了行業預期。Cloudflare首席執行官Matthew Prince將此次技術突破稱為谷歌的“DeepSeek時刻”,認為其有望像去年的DeepSeek模型一樣,通過效率革新打破算力依賴的行業邏輯。
此前,DeepSeek橫空出世,因高性能、低成本的高性價比優勢,市場認為英偉達算力需求預期將變弱,導致英偉達一度暴跌。當時,英偉達的股價一天跌幅17%,市值蒸發了5890億美元。
不過,也有業內人士認為,根據“杰文斯悖論”,當技術進步提高了效率,資源消耗不僅沒有減少,反而激增。回過頭來看,DeepSeek并沒有讓英偉達芯片的需求減少。
摩根士丹利認為,通過大幅降低單次查詢的服務成本,TurboQuant能夠讓原本只能在云端昂貴集群上運行的模型遷移至本地,有效降低AI規模化部署的門檻,這可能反而能進一步提振整體需求。
Quilter Cheviot科技研究主管Ben Barringer認為,近期存儲芯片企業股價下跌可能是由于股東在周期性市場持續增長后套現所致。“TurboQuant的事件加劇了股價下跌的壓力,但這只是漸進式的,而非革命性的,它不會改變行業的長期需求格局。”
此外,TechCrunch相關分析指出,該算法存在局限性,這項技術并不能緩解人工智能模型訓練階段所需的大量內存問題,因為它只是在推理階段對數據進行嚴格的壓縮。
![]()
![]()
運營編輯 |曹倩審核|孟莎莎
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.