萬億級AI算力市場的戰鼓已經擂響,谷歌不再甘于只做英偉達的最大買家之一,而是亮出了自己的芯片武器。
01
谷歌TPU打破英偉達AI霸權
谷歌用十年時間悄悄打造的TPU帝國,正以32億美元的資金擔保為撬棍,試圖掀翻英偉達把持的AI算力王座。
“我們必須在真正應該尊重的地方表示尊重。”英偉達CEO黃仁勛在談及谷歌TPU時這樣說道。這番看似客氣的表態背后,是一場正在重塑全球AI芯片格局的激烈戰爭。
![]()
2025年9月,谷歌與倫敦云服務商Fluidstack達成協議,以32億美元資金擔保為條件,在紐約數據中心部署其第七代Ironwood TPU。這標志著谷歌TPU生態首次突破自家數據中心限制,直接打入英偉達GPU的“鐵桿用戶群”。
隨后,谷歌在11月發布的Gemini 3大語言模型完全基于TPU訓練,表現接近甚至超越OpenAI的ChatGPT。這一技術突破引發市場劇烈反應,谷歌股價單日飆升6.3%,創下歷史新高,而英偉達股價當月下跌近10%。
02
十年磨劍
TPU從自用武器到開放生態的裂變
英偉達憑借GPU和CUDA生態系統,壟斷了AI數據中心80%-90%的市場份額。其技術支撐著從ChatGPT到自動駕駛的關鍵AI訓練與推理任務。截至2025年,云端AI訓練市場中,英偉達憑借CUDA生態占據的份額高達92%。
谷歌的TPU最初只是一個“自救項目”。2013年,谷歌研究人員發現,如果人們每天使用語音搜索并進行3分鐘語音識別,谷歌數據中心需要雙倍算力才能滿足需求。而如果僅通過擴大數據中心規模來滿足算力需求,成本將高昂到無法承受。
![]()
于是,谷歌在2015年啟動了TPU項目,目標不是制造“最強通用芯片”,而是打造“可大量部署在數據中心、用于特定矩陣運算的高能效芯片”。這種專用芯片設計讓谷歌避免了昂貴的“CUDA稅”(即英偉達GPU的高額溢價),并在成本結構上相對于依賴GPU的企業形成巨大優勢。
如今,谷歌的TPU戰略正在發生根本性轉變——從“自產自用”轉向“開放共贏”。谷歌不僅通過Google Cloud向蘋果、Midjourney等公司出租TPU算力,更開始直接與依賴英偉達的小型云服務商談判,試圖將TPU植入對方的數據中心。
03
性能突破
第七代Ironwood的技術飛躍
第七代Ironwood TPU展現了谷歌在AI芯片領域的巨大投入和技術積累。這款芯片是谷歌迄今為止性能最強、能效最高的TPU,其峰值算力達到4614 TFLOPs,內存容量為192GB,帶寬高達7.2 Tbps。
![]()
Ironwood最高配集群可擁有9216個液冷芯片,峰值算力可達42.5 ExaFLOPS,是世界上最大的超級計算機El Capitan的24倍以上。其支持大規模并行處理和高效內存訪問,適用于復雜的推理任務如大型語言模型和混合專家模型。
從架構上看,Ironwood采用了“脈動陣列”設計。該架構由大量簡單的處理單元構成網格,數據在每個時鐘周期同步流經相鄰處理單元。這種設計使得數據在陣列內部被高度復用,最大限度地減少了對高延遲、高功耗主內存的訪問,從而實現了驚人的處理速度。
更為重要的是,Ironwood首次支持FP8計算格式,并在張量核和矩陣數學單元中實現這一功能,這使得其在處理大規模推理任務時更加高效。對于推理成本正成為全球AI公司最大單項支出的今天,這一優化具有重大意義。
04
市場入侵
谷歌鏈挑戰英偉達鏈
谷歌的TPU戰略正在全面升級:從云端租賃擴展到本地部署。谷歌已開始向包括Meta和大型金融機構在內的客戶推銷一項新方案——讓他們在自己的數據中心使用TPU。
![]()
這一戰略調整直擊英偉達的核心客戶群。對于Meta這類大型科技公司,在自己的數據中心部署TPU不僅能滿足更高的安全性和合規標準,特別是對敏感數據的處理,還能大幅降低AI計算成本。
據報道,谷歌在推銷時強調,TPU可能對在自有設施運行AI模型的高頻交易公司特別有幫助。這些公司對低延遲和高效率有極致追求,而TPU在推理任務上的優異表現正好滿足這一需求。
華爾街已經對谷歌的TPU攻勢做出反應。谷歌股價今年累計漲幅達68%,遠超“七巨頭”指數22%的漲幅和納斯達克綜合指數18%的漲幅。D.A. Davidson分析師Gil Luria估計,如果將谷歌DeepMind AI研究實驗室和TPU銷售業務作為獨立部門,其價值將接近1萬億美元。
05
英偉達反擊
黃仁勛的防御與進攻
面對谷歌的強勢進攻,英偉達CEO黃仁勛已迅速采取行動。在谷歌與Anthropic達成提供多達100萬個TPU的協議后,黃仁勛立即宣布向Anthropic投資數十億美元,并獲得了這家AI初創公司使用英偉達GPU的承諾。
![]()
類似的,在OpenAI計劃從谷歌云租用TPU的消息傳出后,黃仁勛與OpenAI達成了高達1000億美元的投資意向,以幫助其開發自己的數據中心。
黃仁勛也公開承認了谷歌在AI芯片方面的進展。他在一次播客中表示,考慮到谷歌已經生產了七代TPU,“我們必須在真正應該尊重的地方表示尊重”。但他也指出,谷歌Gemini模型仍需同時部署在英偉達GPU上。
英偉達還從技術角度展開反擊。公司強調其GPU在通用性、靈活性及性能上均優于谷歌的ASIC類芯片,并表示英偉達的平臺是“唯一能在所有環境運行所有AI模型的解決方案”。英偉達指出,以2020年發布的A100芯片為例,仍在數據中心以高利用率運行,并能在2至3年之外繼續產生可觀的經濟價值。
06
生態較量
CUDA壁壘與JAX的突圍
英偉達真正的護城河不在硬件,而在生態。
CUDA擁有3000萬開發者,92%的AI訓練市場份額,以及從高校到企業的全鏈滲透。其工具鏈如cuDNN、TensorRT持續優化,形成難以撼動的“開發生態霸權”。
![]()
谷歌則選擇差異化突圍,聚焦推理場景,以JAX框架為核心,通過兼容TensorFlow、PyTorch等主流框架,降低開發者遷移成本。JAX今年開發者活躍度提升96%,谷歌還通過TPU研究云(TRC)提供免費算力,吸引研究者加入生態。
谷歌還發布了其模型流水線解決方案“Pathway”,用于向外部開發者訓練大型語言模型。將其作為訓練模型的必備手冊,研究人員無需重新設計模型即可開發Gemini等LLM。這一舉措旨在降低開發者從CUDA生態遷移到TPU生態的門檻。
對于開發者而言,谷歌已告知客戶,他們可以使用與PyTorch相關的軟件來操作TPU,而無需成為Jax專家。這種兼容性策略對降低生態遷移門檻至關重要。
05
點評
AI算力市場的雙軌制發展
AI芯片市場正呈現“雙軌制”發展態勢:英偉達憑借通用性和生態優勢,維持“通用計算溢價”;谷歌則通過TPU在推理場景建立能效壁壘。到2027年,推理市場中ASIC占比預計升至45%,邊緣計算、自然語言處理等垂直領域將成為專用芯片的主戰場。
野村證券的最新報告預計,到2026年,ASIC總出貨量很可能會第一次超過GPU。這標志著AI計算市場正在發生結構性轉變。
![]()
谷歌的TPU制造合作伙伴博通股價今年上漲了63%以上,這也反映出市場對定制ASIC芯片前景的看好。博通不僅僅是谷歌TPU的代工廠商,它實際上擁有著目前世界上最頂尖的高速混合信號IP,是定制芯片生態中不可或缺的一環。
未來AI芯片的競爭,不再是單純算力的比拼,而是生態、場景、能效的綜合較量。英偉達的生態壁壘、谷歌的場景優化、AMD的性價比策略,都將在各自領域找到生存空間。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.