![]()
新智元報道
編輯:桃子 KinghZ
【新智元導讀】全網震撼!馬斯克官宣,全球首個吉瓦級超算Colossus 2正式上線,狂堆55萬塊GPU,目標直指百萬。下一代Grok 5已在訓練,6萬億參數將引爆智能奇點。
全球首個吉瓦級訓練集群!
馬斯克一早激動官宣,專為訓下一代Grok打造的「超算巨獸」Colossus 2,今天正式上線。
![]()
它可是全球首個,達到吉瓦級的AI訓練集群。這是什么概念?

Colossus 2的用電,要比舊金山全市用電峰值還要高。
預計在今年4月,升級到1.5GW,約等于一座大型核電站的輸出。
![]()
OpenAI、Anthropic在內的很多勁敵還在規劃2027年路線圖,xAI這邊直接把「城市級」算力搞定了。
更夸張的,是他們的執行速度:
Colossus 1:從零到全面上線,只用了122天
Colossus 2:剛突破1GW門檻,目標直接沖著總共2GW去
![]()
Epoch AI此前一份報告稱,Colossus 2將擁有相當于140萬塊H100 GPU等效算力
暴力出奇跡,依舊是馬斯克堅信的路線——Scaling算力對于快速逼近「奇點」那一刻至關重要。
畢竟,在馬斯克的敘事中,未來全球最強的AI玩家中,只有谷歌和xAI。
![]()
全球首個GW級超算:55萬GPU
xAI展現出的驚人速度,連老黃都為之驚嘆。他曾這樣高度評價道——
馬斯克對工程學的理解是獨一無二的。別人需要1年完成的事情,xAI僅用19天就搞定了。
外界對于Colossus 1的了解,要比Colossus 2系統得多。
從0開始僅用122天就拔地而起,擁有大約20萬張H100/H200,以及約3萬張GB200 NVL72。
去年,SemiAnalysis高級分析師一篇文章,曾深度分析了Colossus 2工程設計和所取得的成就。
接下來,就扒一下其背后的細節。
![]()
六個月,從0到200MW
Colossus 2項目,于2025年3月7日啟動。
它將配備55萬塊芯片,由GB200和GB300 GPU組成,最終未來擴展到百萬GPU。
當時xAI在孟菲斯(Memphis)收購了一個100萬平方英尺的倉庫,以及兩個總計100英畝的相鄰地塊。
![]()
不到六個月的時間,SemiAnalysis統計了現場已部署119臺風冷冷水機組,即大約200MW的冷卻能力。
這就足以驅動,大約11萬張GB200 NVL72。
而且,這個巨大的超算,全部采用的是液冷設計。
![]()
馬斯克一條推文顯示,一些機架在7月份就已經安裝好了
令人驚嘆的是,xAI只用了6個月就完成了甲骨文、OpenAI花了15個月才完成的工作!
據介紹, Colossus 2造價高達數百億美元。而xAI現在基本沒外部收入,主要靠母公司X輸血。
而且,報告里特意提了一嘴——
馬斯克跟中東幾個「土豪」關系很鐵,沙特、阿聯酋、卡塔爾的主權基金,都是潛在的金主。
![]()
Grok 5在訓,奇點更近了
Colossus 2的全面上線,也意味著「全球首個吉瓦級大模型」——Grok即將出世。
馬斯克曾堅定地表示,xAI有機會通過Grok 5實現AGI。
![]()
![]()
此前,在一期采訪中,馬斯克還表示Grok 5擁有高達6萬億參數,而且智能密度更高,預計將在上半年發布。
不僅如此,它還原生支持視頻理解。
![]()
可以預見,在首個吉瓦級超算上訓出的Grok 5,實力一定超乎想象。
爆沖2GW,今年上線
去年12月底,馬斯克斥資超200億美元,買下了孟菲斯第三棟建筑,計劃將Colossus總容量擴展至2GW。
這棟新建筑——MACROHARDRR,延續了Macrohard命名,位于Colossus 2旁,占地面積超80萬平方英尺。
![]()
![]()
Grok估計,在2025年中,按AI算力排名前10中,Colossus 2和特斯拉Dojo位居第一和第7:
![]()
在AI算力上,馬斯克瘋狂加碼,甚至他「已經在規劃10GW甚至更高的算力」。
![]()
狂飆吉瓦級超算,硅谷巨頭亂戰
如今,全世界AI巨頭們,正掀起一場前所未有的算力軍備賽。
除了馬斯克xAI之外,OpenAI、Meta、Anthropic也在紛紛加碼,目標直指吉瓦(GW)級,甚至更大規模的AI超算。
![]()
2022年GPT發布以來,OpenAI、xAI、Anthropic、Meta Superintelligence等AI訓練算力飆升
OpenAI:星際之門
「星際之門」,便是眾所周知的典型代表之一。
2025年1月初,OpenAI聯合軟銀、甲骨文等伙伴正式啟動了名為「星際之門」(Stargate)的宏大計劃。
這項「AI曼哈頓計劃」,要在未來4年砸5000億美金,建設總容量達到10GW的集群。
首期立即部署1000億美元,如今進展迅猛。
![]()

去年9月,OpenAI公布了五個新站點,要在未來三年,實現7GW算力規模。
這樣的規模相當于同時為數百萬家庭供電,卻全部用于驅動AI訓練與推理。
![]()
Meta:普羅米修斯
Meta同樣在加速狂奔。
早在去年,小扎就公開了資金代號Prometheus(普羅米修斯)的GW級AI超算項目,目標在2026年上半年上線。
![]()
不僅如此,Meta正在建設多個吉瓦級集群:
Prometheus預計2026年率先達到1GW+
后續的Hyperion項目,計劃逐步擴展到5GW規模,占地堪比曼哈頓相當一部分區域
![]()
幾天前,小扎再次重磅宣布啟動全新頂級計劃——Meta Compute。
計劃明確表示,將在本十年內建設數十吉瓦AI超算,長期目標甚至指向數百吉瓦級別。
![]()
為此,Meta內部已組建專責團隊,并與核電企業簽訂長期協議,確保能源供應跟得上瘋狂擴張的步伐。
Anthropic:百萬TPU下單,GPU也要
Anthropic選擇了一條更聚焦的路線:深度綁定Google Cloud的TPU。
去年10月官宣,將把Google Cloud TPU擴展到最多100萬顆TPU,合同價值數百億美元。
![]()
而且,預計在2026年上線遠超1GW的容量。
![]()
而且,Anthropic采用多平臺策略,同時使用谷歌TPU、亞馬遜Trainium和英偉達GPU。
如今,AI競賽的勝負手,正從模型參數本身向基礎設施傾斜。
硅谷巨頭們狂建超算,原因很簡單:下一代前沿模型所需的算力遠超想象。
這場吉瓦級超算的全球軍備賽,才剛剛拉開帷幕。
6千億算力投資,AI榨干美國人錢包?
網友直呼,馬斯克的算力賭注「太瘋狂了。AGI最難的部分已不再是數學,而是字面意義上的能不能找到足夠多的電源插座」。
![]()
2026年,這一趨勢只會愈演愈烈——
亞馬遜AWS、微軟、谷歌、Meta、甲骨文(Oracle)等超級云計算巨頭正加速擴張。
![]()
它們的資本支出預計將超過6000億美元,重點已全面轉向AI專用基礎設施建設,邊緣服務成為次要關注點。
獨立的市場研究和分析公司Dell’Oro分析師Baron Fung指出:「預計在未來2至3年內,這些部署將新增數十GW總電力容量,反映出加速計算對算力規模和密度提出了極高要求。」
![]()
Baron Fung是戴爾奧羅集團(Dell’Oro Group)的高級研究總監,負責數據中心IT資本支出、半導體與組件,以及以太網適配器與智能網卡研究項目
雖然整體趨勢是「全面轉向AI」,但各家打法并不相同:
亞馬遜與谷歌聚焦自研AI加速器,圍繞內部芯片構建數據中心;
微軟則持續重金押注OpenAI以及自己的AI平臺戰略;
Oracle借Stargate項目強勢崛起,迅速構建新一代AI算力園區;
Meta正在打造當前全球最龐大的AI數據中心項目,代表作包括Prometheus與Hyperion。
Baron Fung表示,這類新一代數據中心將集成大規模AI集群、高密度加速卡機架、先進網絡連接與支持型存儲系統。
「預計未來2到3年內,數十GW級的新超級數據中心產能將陸續上線,服務對象既包括內部AI平臺,也涵蓋大客戶的關鍵AI工作負載。」Fung總結道。
但與此同時,電力短缺、設備交付周期拉長以及地方政府與社區的反對,也讓擴張變得日益困難。
那些AI數據中心年入千萬美元,而且零交通壓力,零學區負擔,看起來只會帶來現金流。
這番說辭深得美國政界青睞——白宮如此,各州政府亦如此。
但對數據中心附近的居民而言,「根本沒有好處可言」。
因為這些算力設施全天候24小時運轉,內部部署著數以千計的服務器,而服務器需要大量電力與水來保持冷卻。
一方面,數據中心建設熱潮助推了AI革命;另一方面,AI熱潮可能耗盡美國電網資源、榨干普通人的錢包。
![]()
AI正在推高電價,而沒有人對此感到滿意。甚至有媒體稱:
美國對數據中心的「戰爭」即將到來。
![]()
2025年12月1日,密歇根州塞林(Saline)的居民集會,反對一座耗資70億美元的「星際之門」(Stargate)數據中心。
根據美國能源信息署(EIA)的數據,自2022年以來,全美幾乎所有地區的居民零售電價漲幅均超過通脹率,且這一現象很可能持續至2026年。
比如,去年,新澤西州的電費賬單上漲了約 20%。
![]()
美國電價飆升的深層矛盾源于積弊數十年的結構性問題:老化的基礎設施亟待更新,而過時的商業模式與法規體系拖慢了電網升級的步伐。
而數據中心建設浪潮,給美國的電力供應體系前所未有的難題。
據《Data Center Watch》統計,反對數據中心建設的浪潮正在加速:
2025年僅第二季度就有980億美元的在建項目受到阻礙或嚴重拖延。
去年上半年,美國已有36個項目涉及投資高達1620億美元的AI算力項目受到阻礙或嚴重拖延。
![]()
如果說AI熱潮給全世界帶了硬件短缺,那給美國帶來的更嚴重的問題將是電力短缺。
保算力,還是保電力,成了美國不得不考慮的問題。
要支持數十GW級的新超級數據中心產能,電力而非算力卡了美國AI的脖子。
參考資料:
https://x.com/elonmusk/status/2012500968571637891?s=20
https://x.com/MobofJoggers/status/1947708915958870344?s=20
https://x.com/mark_k/status/2012510296485618078
https://x.com/elonmusk/status/2012500968571637891
https://x.com/XFreeze/status/2012493620331610607
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.