![]()
10月29日,英偉達股價大漲,成為全球第一家市值突破5萬億美元的企業。而在2023年5月30日,英偉達才剛剛邁入萬億美元市值俱樂部。
英偉達的爆發,再次證明了“賣鏟人”的價值。引爆這一輪AI行情的大模型公司們普遍尚未盈利,但英偉達兩年賺了超過1000億美元。
在整個生態中,英偉達成為唯一一家賺到巨額實際利潤的企業,反映出AI產業鏈并未處于健康狀態。但各家公司別無選擇,GPU具備處理大量并行計算的能力,天然適合大模型訓練和推理。而GPU行業玩家寥寥,英偉達在AI計算加速芯片領域處于實質性壟斷地位,2024年全球市場份額超過80%。
這種情況下,問題出現了:英偉達的壟斷優勢能保持多久?市場上何時出現一個足以抗衡英偉達的挑戰者?
目前來看,除老對手AMD外,市面上存在兩類挑戰者,一類是試圖擺脫英偉達GPU依賴的國際巨頭,以谷歌為代表;另一類則是面臨美國AI芯片出口制裁困境下,不得不自主研發AI計算加速芯片的中國企業,包括華為、寒武紀、摩爾線程、海光信息、壁仞科技等。
這些企業都不愿意接受被英偉達“卡脖子”,因此不斷投入資金研發技術或扶持競爭勢力。AMD、摩爾線程沿用GPU路線,直接正面硬剛;谷歌、華為等企業則選擇比GPU效率更高的ASIC路線,雖然難題不少,但潛力巨大。
從技術和商業層面來看,毫無疑問,英偉達很難長期保持壟斷優勢,未來行業內必然將出現足以抗衡英偉達的挑戰者,剩下的只是時間問題。
國際巨頭和國內對手,挑戰英偉達
目前來看,這些挑戰者與英偉達仍有明顯差距,但潛力也不容小覷。
在這些挑戰者中,AMD是英偉達的老對手。據官方數據,AMD當前量產的最新產品MI355X芯片推理性能優于英偉達B200,僅次于英偉達當前最強量產產品B300。
但整體來看,MI355X雖然采用了臺積電的3nm工藝,但并沒有顯著領先4nm的英偉達B200,同時在軟件生態、互聯、數據傳輸等領域顯著落后于英偉達。
除AMD外,國內外兩類英偉達的挑戰者,第一類是以谷歌為代表的國際巨頭。
谷歌是AI領域的老牌巨頭,底蘊深厚,早在2013年就開始了TPU(Tensor Processing Unit,張量處理單元)的研發,這是一款專為機器學習和深度學習任務加速設計的專用集成電路芯片(ASIC),2016年5月首次公開并應用于AlphaGo上,目前已經迭代至第7代。
今年4月發布的Ironwood TPU v7,在單芯片FP8算力、內存配置、內存帶寬等方面已經媲美英偉達B200。同時,超強的規模擴展能力,也被視為谷歌TPU的最大優勢。目前,推出Claude模型的Anthropic是谷歌最大的客戶之一。
不過,谷歌TPU目前并不對外出售商品,僅以谷歌云服務對外出租算力,其生態體系也有待完善,目前客戶群體遠不如英偉達。
除谷歌之外,幾乎所有大型AI公司都在加速自研AI芯片。如OpenAI和xAI一邊大舉購買英偉達芯片,另一邊推動自研算力芯片進展,Meta也被媒體爆出正與博通合作開發定制芯片。
國內則是另一番景象。從2022年開始,美國開始限制對中國的AI芯片出口,之后不斷升級,目前英偉達H20可以進入國內市場,但被曝出有“漏洞后門”,存在安全風險,未來市場銷售存在較大不確定性,英偉達算力更高的H100及更高等級的產品仍被禁止進入國內市場。
在這種情況下,國內企業加速算力替代步伐,形成多條路線,如摩爾線程與英偉達一樣主打全功能GPU,既支持AI計算加速,也具備圖形渲染、視頻解碼、物理仿真等功能。
目前,摩爾線程是國內唯一一家量產的全功能GPU(既能做圖形顯示渲染也能進行AI計算加速)企業,在招股書中,摩爾線程表示,其最新的S5000計算加速卡在FP32精度上,算力為32TFlops,這一數據接近英偉達的H20的44TFLOPS。
海光信息、壁仞科技、沐曦股份等企業則與AMD類似主打GPGPU(省去圖形功能專做AI計算加速),專注執行AI計算加速業務。華為海思、寒武紀兩者為非GPU路線,也采用與谷歌一樣的ASIC路線,定制AI計算加速芯片,推出NPU(嵌入式神經網絡處理器)產品。
華為目前量產的昇騰910C,據媒體報道其推理性能已經達到英偉達H100的60%。今年8月,據華為云CEO張平安介紹,華為云服務生產效率已經達到英偉達H20芯片的3倍。
寒武紀是國內ASIC路線先行者,其現有的思元590芯片,外界普遍認為其性能達到英偉達A100的80%。
2024年,國內AI計算加速市場,英偉達排名第一,仍占據54.4%的市場份額。華為海思份額為21.4%,AMD市場份額為15.3%。
從市場份額來看,華為海思是國內AI計算加速芯片龍頭,其他國產AI芯片企業仍有待突破。在大國競爭的邏輯下,國產算力正在加速發展,成為替代英偉達的另一支重要力量。
綜合來看,國內外AI計算企業,已經形成了抗衡英偉達的兩條主線,在行業發展的迫切需求下,這場挑戰英偉達的長期戰役已經打響。
ASIC技術,或為抗衡英偉達的關鍵
目前來看,英偉達的競爭對手距離英偉達尚有著明顯差距,但從技術和商業角度來看,英偉達的壟斷地位很難長期保持下去。
技術層面,近年來不斷發展的大模型以及備受關注的世界模型,均需對海量數據進行處理,因此對算力的需求持續增長。
展望未來,除非有顛覆性的技術出現,AI模型必然也需要面對更多各層面數據,從而實現真正的人工智能。這也意味著,AI行業的算力需求很難停止。
從這個基礎出發,用專門定制的AI計算芯片(即ASIC)替代現有的GPU更符合半導體芯片的迭代邏輯:效率優先。
“效率優先”的邏輯在半導體行業歷史悠久,在目前芯片種類中,能效比排序為ASIC>FPGA(現場可編程門陣列)>GPU>CPU。在對效率的追求下,行業應用芯片大多遵循上述邏輯進行迭代。
眾所周知,人們最早用CPU進行圖像渲染,之后為了提升效率,出現了專門用于處理像素點的GPU,更專業的產品帶來了更強的處理效率。
在此前的比特幣礦機領域也是如此。人們最早用家用電腦CPU就能挖比特幣,但隨著挖礦難度提升,人們轉向效率更高的GPU。
之后,為了進一步提升挖礦效率,企業專門開發出FPGA。后續隨著挖礦算法固定,ASIC芯片成為最終選擇。
GPU可以運行大量并行計算,通用性和靈活性更強。AI的計算任務較為單一,ASIC芯片則完全為AI訓練和推理定制,計算能力上限更高,具備較強的取代GPU的潛力,這也是谷歌、華為等企業選擇ASIC路線的原因之一。
目前全球表現最為突出的ASIC芯片即是前文所說的谷歌TPU,其紙面實力已經媲美英偉達次旗艦產品B200,也被市場認為是英偉達的最強對手。
去年7月底,蘋果公司曾發布過一篇論文,展示蘋果公司用谷歌TPU芯片訓練其AI 模型。消息一出,英偉達股價暴跌超7%。
除此之外,國內華為海思、寒武紀的NPU,在特定領域上也呈現出了對英偉達GPU的一定替代作用。
商業層面的邏輯更為簡單,基于AI行業對算力的龐大需求將長期存在的預期,無論從成本還是供應鏈安全方面考慮,AI巨頭們必然將持續推動自研AI芯片或扶持新的AI芯片供應商的進程,這一點將是毫無疑問的。
目前,英偉達也在不斷調整布局以應對被替代的風險。技術層面,布局ASIC領域。此前有消息稱,英偉達已成立ASIC部門,將招募超過1000名芯片設計、軟件開發和AI研究人員。
歷史發展中,英偉達也曾借鑒谷歌TPU推出了Tensor Core來進行矩陣運算。在這之后,從Volta、Ampere、Hopper到最新的Blackwell架構,Tensor Core數量和尺寸不斷增加,從而帶來了更強的計算能力。
商業層面,近年來英偉達進行了密集的AI領域投資,投資對象不僅有OpenAI、xAI這些巨頭,也有一些具備潛力的中小型公司,從廣泛的投資布局來綁定下游客戶、押注潛在的技術路線和發展方向,強化自身生態體系,以抵御可能的發展風險。
不過,從任何角度來看,AI行業都不想要一個處于壟斷地位的英偉達,抗衡英偉達的挑戰者的出現,或許只是時間問題。
文/董武英
PS:如果你對AI大模型領域有獨特的看法,歡迎掃碼加入我們的大模型交流群。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.