杰西卡 發(fā)自 副駕寺
智能車參考 | 公眾號 AI4Auto
老黃人在北京侃侃而談,沒想到轉(zhuǎn)眼老家被“偷”,客戶變對手。
![]()
特斯拉的最新消息,Dojo二代芯片量產(chǎn)進入倒計時,性能比第一代提高10倍,算力直逼英偉達Blackwell B200芯片
這很可能會讓特斯拉FSD實現(xiàn)“自產(chǎn)自訓(xùn)”,從此擺脫英偉達的束縛,甚至能向外部提供算力。
更關(guān)鍵的是,特斯拉表示,Dojo 2超算能讓數(shù)據(jù)訓(xùn)練速度猛增一個數(shù)量級,也意味著FSD的優(yōu)化能再上一個臺階。
![]()
不過在馬斯克這兒,還不夠。
算力更強、性能巔峰的Dojo第三代芯片,時間表也定了,明年就推出。
特斯拉Dojo 2量產(chǎn)倒計時
據(jù)外媒平臺Not a Tesla App稱,特斯拉新一代Dojo 2芯片,已和全球最大的半導(dǎo)體制造商——臺積電達成合作,年底前進入量產(chǎn)階段。
臺積電方面也透露過,第二代Dojo的訓(xùn)練模塊已投入生產(chǎn),且采用了臺積電最新的封裝技術(shù)。
![]()
特斯拉多次表示,Dojo 2芯片已經(jīng)接近英偉達Blackwell B200水平——這是英偉達最新一代的AI芯片,性能也最強。
在馬斯克的另一家公司X平臺上,也有人分享了這個消息:
![]()
不少“特粉”表示,足夠令人振奮。
因為這意味著,特斯拉實現(xiàn)了從傳感器到超算的垂直AI能力,即將擺脫英偉達的束縛:
![]()
甚至,特斯拉未來可以向外提供算力,成為英偉達的對手。
并且自研芯片最利好的就是成本,特斯拉將有能力以前所未有的速度擴大規(guī)模:
![]()
還有網(wǎng)友已經(jīng)“預(yù)見”到未來的驚天巨變,認為Dojo 2很有可能會改變汽車和AI行業(yè)的游戲規(guī)則:
![]()
也有人對真實性存疑,畢竟,馬斯克定下的ddl總是設(shè)定在年末,但真正兌現(xiàn)的情況并不多見:
![]()
不過,馬斯克倒是在評論區(qū)現(xiàn)身說法,回應(yīng)很簡潔:“Dojo 2是一臺很好的計算機”,算是暗戳戳地肯定了量產(chǎn)時間屬實。
緊接著他又講了個經(jīng)典的計算機硬件性能笑話——
- Dojo 2可以以每秒十億幀的速度玩《孤島危機》。
![]()
提醒一下不知道的朋友,《孤島危機》是2007年發(fā)行的一款游戲,起初對配置要求極高,不知道燒壞了多少顯卡,被玩家一致調(diào)侃為“顯卡危機”。
后來是英偉達向游戲官方提供了技術(shù)支持,英偉達曾多次用“可以玩《孤島危機》”,證明其配置硬核。
現(xiàn)在,這個玩笑也被馬斯克也拿出來證明Dojo二代芯片的性能,算是里里外外都和英偉達對標(biāo)了。
那么Dojo到底有多厲害,能和全球第一的AI公司杠上?
馬斯克布局6年的關(guān)鍵基建
所謂Dojo,就是馬斯克親自推動、為了訓(xùn)練FSD神經(jīng)網(wǎng)絡(luò)而自研的AI超級計算平臺
關(guān)于“Dojo”的概念,最早是在2019年特斯拉的自動駕駛?cè)丈希获R斯克和AI團隊首次提及。
馬斯克多次強調(diào),視覺是實現(xiàn)FSD的關(guān)鍵,強大的神經(jīng)網(wǎng)絡(luò)需要海量視頻數(shù)據(jù)訓(xùn)練。
![]()
特斯拉的純視覺方案,每天會產(chǎn)生1600億幀的視頻數(shù)據(jù)。
這些視頻需要逐一進行分析、標(biāo)記和處理,幫助FSD不斷學(xué)習(xí)新的邊緣場景(即不可預(yù)測的罕見情況),這對于堅持不用激光雷達的特斯拉而言至關(guān)重要。
而當(dāng)時,即便強如英偉達,其算力也很難滿足特斯拉對大規(guī)模視頻訓(xùn)練的需求,并且缺乏針對視頻訓(xùn)練的專用指令集。
這讓特斯拉產(chǎn)生了自研芯片、打造高性能視頻訓(xùn)練超算的念頭。因為一旦成功,特斯拉的FSD訓(xùn)練效率將從根本上被改變。
在這種背景下,第一代Dojo及其自研芯片D1,首次亮相于2021年的特斯拉AI Day上,不過當(dāng)時還只是Demo。
![]()
D1芯片是Dojo的核心,由臺積電7nm工藝制造,有500億個晶體管,芯片面積為645mm2,小于英偉達的A100(826 mm2)和AMD的Arcturus(750 mm2)
每個芯片有354個訓(xùn)練處理節(jié)點,以及440MB的靜態(tài)隨機存儲器,BF16精度下算力高達362TFLOPs,一塊芯片功耗只有400W。
![]()
D1芯片測試完成后,會被封裝到Dojo訓(xùn)練瓦片(Tile)上,每個瓦片容納25顆D1,這就是最終的Dojo。
當(dāng)時的Dojo有超過50萬個訓(xùn)練節(jié)點,每個模塊算力為9 petaflops,每秒36 TB的區(qū)塊外帶寬。
而120個Dojo組合在一起,就是當(dāng)時超算的頂級配置——Dojo ExaPOD,集結(jié)3000塊D1芯片,擁有超1百萬個訓(xùn)練節(jié)點,算力達到1.1EFLOP。
不過,特斯拉也表示,當(dāng)時的D1芯片還不能完全為Dojo提供計算支持,需要和英偉達的GPU一起工作,之后會逐步擴大D1和Dojo使用的占比。
![]()
次年9月,特斯拉展示了首個Dojo機柜,進行了2.2兆瓦的負載測試,還演示了運行Stable Diffusion模型生成“火星Cybertruck”圖像的能力,以證明其AI訓(xùn)練通用性。
![]()
直到2024年1月,特斯拉投資5億美元(約36億元),在紐約工廠打造了Dojo集群,承擔(dān)起特斯拉5%~10%的智能輔助駕駛訓(xùn)練數(shù)據(jù)量。
只不過,特斯拉這時候仍是“自研+合作”雙路徑運行,沒有擺脫對英偉達的依賴。
但這一切,可能都會隨著今年Dojo 2芯片的量產(chǎn)而改變。
據(jù)特斯拉透露,新一代Dojo芯片仍由臺積電代工,解決了上一代Dojo的靜默數(shù)據(jù)損壞(SDC)和功耗問題,性能將比上一代提升10倍
靜默數(shù)據(jù)損壞,就是超算存在有缺陷的節(jié)點,可能導(dǎo)致耗時數(shù)周的AI模型訓(xùn)練產(chǎn)生錯誤結(jié)果,或使收斂速度顯著放緩,并且這種缺陷很難被第一時間檢測
![]()
而Dojo 2實現(xiàn)性能大漲,原因來自多方面,包括優(yōu)化了D1的核心架構(gòu),采用更密集的mesh網(wǎng)絡(luò)互聯(lián)架構(gòu)擴展帶寬,模塊化規(guī)模更大、集成度更高等等。
其中最值得一提的是臺積電的最新封裝技術(shù)——InFO-SoW
這是一種晶圓級系統(tǒng)集成技術(shù),就是把整個晶圓當(dāng)作一個整體,把多顆芯片、電源模塊、散熱結(jié)構(gòu)等直接集成在晶圓上,而不再是傳統(tǒng)方式中先切割晶圓,再單獨封裝芯片的方法。
Dojo將直接在整片晶圓上集成25個計算芯片,在645平方毫米的晶片上放置500億個晶體管,單晶粒提供362 TFlops的運算能力。
也就是說,一個晶圓就相當(dāng)于一個超算模塊,單一Dojo就擁有9 Petaflops(每秒千兆次)的算力。
![]()
同時,新的封裝技術(shù)取消傳統(tǒng)封裝中的基板(PCB)和中介層,芯片之間通過超高密度金屬布線直接進行高帶寬連接,數(shù)據(jù)傳輸速度翻倍增長。
散熱模組則被直接集成在晶圓背面,熱量通過金屬板快速導(dǎo)出,顯著改善了散熱問題。
據(jù)特斯拉介紹,Dojo 2已經(jīng)能夠達到接近、甚至部分超越英偉達B200的水平。
例如其單訓(xùn)練瓦片算力可達1000 TOPS,高于B200單芯片的900 TOPS;Dojo 2的瓦片模塊間帶寬達36TB/s,也是B200的NVLink 5(10TB/s)的3.6倍。
也就是說,特斯拉或許很快就能脫離外部GPU的依賴,實現(xiàn)“計算自由”。
而且,Dojo雖然是為FSD而生,卻也適用于其他應(yīng)用領(lǐng)域,比如同樣需要“視覺”的特斯拉機器人擎天柱。
![]()
此外,Dojo 2還不是特斯拉超算實力的終點。
馬斯克曾表示,Dojo實現(xiàn)起來“可能不抱希望”,并且應(yīng)當(dāng)是“三代出巔峰”。Dojo 3將是特斯拉超算的最強水平,性能還會是Dojo 2的40倍
而Dojo 3的推出時間已經(jīng)不遠,預(yù)計2026年就會問世。
馬斯克不愧是馬斯克。
從公開首次提出概念,到二代產(chǎn)品即將追平世界頂尖水平,不過六年時間。
其實透過特斯拉的例子看中國汽車行業(yè),同樣大有啟發(fā)。
AI基礎(chǔ)設(shè)施,中國車企的新戰(zhàn)場
馬斯克之前,中國車圈沒有類似的先例。
現(xiàn)在,雖然能完全獨立的超算芯片還沒真正看到落地,但他的做法已經(jīng)給了中國車圈啟發(fā)。
自動駕駛發(fā)展,有三大核心要素:算力、數(shù)據(jù)、算法,它們也被統(tǒng)稱為AI基礎(chǔ)設(shè)施。
現(xiàn)在,車圈已經(jīng)有不少玩家和特斯拉類似,在這些AI基礎(chǔ)設(shè)施上布局。
算法方面,不用多說,這是各家車企最先爭奪的智能化戰(zhàn)場。
![]()
數(shù)據(jù)方面,比亞迪在深圳構(gòu)建了超級數(shù)據(jù)閉環(huán)平臺,數(shù)據(jù)每日回傳規(guī)模達PB級別,蔚來在上海與合肥建立了雙數(shù)據(jù)中心,與部分外部云平臺(阿里、AWS)一起協(xié)同工作。
算力方面,有蔚來自研的神璣NX9031芯片,小鵬自研的圖靈芯片。
也有比亞迪成立先進技術(shù)研發(fā)中心,自建AI超算平臺,吉利、長城、蔚小理等也都打造了自己的智算中心。
通過這些車企動作,可以得出一個汽車行業(yè)更遠的趨勢是:
車企智能化戰(zhàn)場,已經(jīng)從單純的智能化功能疊加,轉(zhuǎn)向更持久的AI基建能力。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.