![]()
文|錢眼君
來源|博望財(cái)經(jīng)
歲末年初,中國(guó)資本市場(chǎng)的聚光燈前所未有地聚焦于黃浦江畔。一場(chǎng)聲勢(shì)浩大的“GPU旋風(fēng)”正席卷而來:在不到一個(gè)月的時(shí)間里,沐曦股份、壁仞科技、天數(shù)智芯三家扎根上海的GPU企業(yè)密集登陸資本市場(chǎng),而與其并稱“上海GPU四小龍”的燧原科技,也已完成IPO輔導(dǎo),即將為這場(chǎng)盛宴落下最后一塊拼圖。
從科創(chuàng)板首日暴漲692.95%的造富神話,到港交所超2300倍的驚人認(rèn)購紀(jì)錄;從百億級(jí)的IPO募資規(guī)模到千億市值俱樂部的批量誕生,國(guó)產(chǎn)GPU企業(yè)正以其凌厲的資本攻勢(shì),宣告著國(guó)產(chǎn)算力產(chǎn)業(yè)一個(gè)新時(shí)代的來臨。
這并非偶然的資本狂歡。沐曦股份憑借在手訂單14.3億元及"千卡集群"的商業(yè)化落地,上市首日市值即突破3000億元,創(chuàng)下多項(xiàng)紀(jì)錄;壁仞科技作為"港股國(guó)產(chǎn)GPU第一股",獲得23家基石投資者力挺;天數(shù)智芯則以首家實(shí)現(xiàn)國(guó)產(chǎn)7nm訓(xùn)練推理通用GPU量產(chǎn)的身份,攜覆蓋20多個(gè)行業(yè)的業(yè)績(jī)登陸港交所。
然而,光環(huán)之下亦有隱憂:天數(shù)智芯三年半累計(jì)虧損超28億元,壁仞科技同期虧損超63億元,揭示出這個(gè)高投入、高風(fēng)險(xiǎn)行業(yè)在搶占窗口期時(shí)的"流血沖鋒"本質(zhì)。
這是一場(chǎng)關(guān)乎智能未來的產(chǎn)業(yè)競(jìng)速賽:一邊是國(guó)際巨頭以"黃氏定律"般的速度壘高技術(shù)壁壘,一邊是中國(guó)本土力量在資本與政策的雙重加持下集體破局。而要理解這場(chǎng)競(jìng)賽的深層邏輯,我們必須回溯GPU從游戲配件到算力核心的蛻變之路。
01
定義核心:從圖形助手到算力引擎的蛻變
在探討這場(chǎng)席卷全球的算力革命之前,我們先來厘清一個(gè)核心概念——GPU。GPU全稱Graphics Processing Unit,圖形處理器。我們常聽說的CPU(Central Processing Unit)是指中央處理器,它與GPU的核心差異在于架構(gòu)設(shè)計(jì):CPU通常擁有少數(shù)幾個(gè)強(qiáng)大的核心,擅長(zhǎng)處理復(fù)雜的通用串行任務(wù),如同一位能解奧數(shù)題的中學(xué)生;而GPU則集成數(shù)千個(gè)相對(duì)簡(jiǎn)單的核心,專為處理海量同質(zhì)化的并行任務(wù)而生,好比幾百個(gè)小學(xué)生協(xié)作完成數(shù)萬道加減法。
![]()
圖:GPU在計(jì)算機(jī)中的位置,公開資料整理。
如果說CPU是計(jì)算機(jī)的"大腦",負(fù)責(zé)決策與控制,那么GPU則是專精于"大規(guī)模重復(fù)勞動(dòng)"的"肌肉",其并行計(jì)算的天性,使其在圖形渲染和高效能矩陣運(yùn)算(人工智能的核心)中的效率遠(yuǎn)超CPU。
隨著5G與人工智能時(shí)代的到來,數(shù)據(jù)中心內(nèi)機(jī)器學(xué)習(xí)等AI計(jì)算已占據(jù)總計(jì)算量的四分之一到三分之一,大數(shù)據(jù)處理的重任正從CPU向算力更強(qiáng)的GPU轉(zhuǎn)移。GPU的應(yīng)用早已超越傳統(tǒng)的個(gè)人電腦圖形顯示,其形態(tài)按接入方式可分為獨(dú)立與集成;其疆域已擴(kuò)展至移動(dòng)設(shè)備、數(shù)據(jù)中心服務(wù)器與個(gè)人電腦等多個(gè)場(chǎng)景。尤其在AI與云計(jì)算浪潮下,GPU憑借其與生俱來的并行計(jì)算優(yōu)勢(shì),成為了數(shù)據(jù)處理的核心引擎,開辟出一個(gè)規(guī)模空前的增長(zhǎng)市場(chǎng)。盡管FPGA和ASIC等更為專用的計(jì)算芯片也在特定領(lǐng)域嶄露頭角,但行業(yè)共識(shí)在于,GPU憑借其卓越的通用性、成熟的軟件生態(tài)(尤其是英偉達(dá)的CUDA)及強(qiáng)大的綜合算力表現(xiàn),仍是當(dāng)前AI計(jì)算領(lǐng)域無可爭(zhēng)議的霸主與主導(dǎo)架構(gòu)。
這一定位,是理解其萬億級(jí)產(chǎn)業(yè)價(jià)值的邏輯起點(diǎn)。
02
GPU從哪來:一部從游戲顯卡到AI基石的創(chuàng)業(yè)史
GPU產(chǎn)業(yè)的崛起,是一部典型的硅谷技術(shù)創(chuàng)業(yè)史詩,而其主角無疑是英偉達(dá)(NVIDIA)。故事的開端可追溯至1989年——幾位工程師共同勾勒了一款新圖形加速器的藍(lán)圖。1993年,英偉達(dá)正式成立,開始的創(chuàng)業(yè)之路充滿坎坷,至1995年,公司面臨設(shè)計(jì)出芯片卻無資金建廠制造的困境。創(chuàng)始人黃仁勛致信臺(tái)積電創(chuàng)始人張忠謀求助,并成功獲得支持。
這段合作被黃仁勛本人視為關(guān)鍵轉(zhuǎn)折:"如果當(dāng)初我自己建廠生產(chǎn)GPU芯片,我現(xiàn)在可能就是一個(gè)守著幾千萬美元的公司的安逸的CEO。"臺(tái)積電的代工模式讓英偉達(dá)得以輕資產(chǎn)運(yùn)營(yíng),聚焦設(shè)計(jì)與創(chuàng)新,從而快速迭代產(chǎn)品,搶占市場(chǎng)。
1999年,英偉達(dá)做出了兩個(gè)定義行業(yè)的舉動(dòng):一是徹底轉(zhuǎn)型專注于顯卡芯片,二是首次在全球提出"GPU"這一革命性概念(但在提出這個(gè)概念以后的相當(dāng)一段時(shí)間內(nèi),GPU還僅僅用于圖形處理,遠(yuǎn)不像現(xiàn)在這般如雷貫耳)。同年,公司在納斯達(dá)克上市,市值達(dá)6.26億美元,開啟了長(zhǎng)達(dá)二十余年的高速增長(zhǎng)傳奇。
然而,硬件性能的領(lǐng)先并非其構(gòu)筑護(hù)城河的終極武器。真正的"神來之筆"發(fā)生在2006年,英偉達(dá)在推出新一代GPU的同時(shí),發(fā)布了具有劃時(shí)代意義的CUDA計(jì)算平臺(tái)。CUDA即Compute Unified Device Architecture,統(tǒng)一計(jì)算架構(gòu),本質(zhì)上是一套軟件工具,它讓開發(fā)者能夠以前所未有的便捷性,調(diào)用GPU的強(qiáng)大算力進(jìn)行通用計(jì)算(GPGPU),這為后來深度學(xué)習(xí)的爆發(fā)埋下了伏筆。
起初,CUDA的商業(yè)價(jià)值并未被市場(chǎng)立刻接受。但英偉達(dá)展現(xiàn)出了驚人的戰(zhàn)略耐心與遠(yuǎn)見:向全球高校和研究所免費(fèi)開放并設(shè)立研發(fā)中心;以資金扶持創(chuàng)業(yè)公司使用;持續(xù)開源核心軟件庫;甚至確保廉價(jià)的消費(fèi)級(jí)游戲顯卡也支持CUDA,將開發(fā)門檻降至千元級(jí)別。
經(jīng)過十余年不計(jì)短期回報(bào)的持續(xù)灌溉,CUDA逐漸從一款開發(fā)工具,演進(jìn)為高端計(jì)算與圖形領(lǐng)域的事實(shí)標(biāo)準(zhǔn),構(gòu)筑了堪比操作系統(tǒng)般的深厚生態(tài)壁壘。即便競(jìng)爭(zhēng)對(duì)手的GPU硬件性能參數(shù)相近,但在AI開發(fā)社區(qū)的受歡迎程度卻有天壤之別,核心差距就在于CUDA所帶來的開發(fā)效率與計(jì)算效能倍增。
![]()
圖:關(guān)于CUDA的描述,來自英偉達(dá)官網(wǎng)
直到2014年前后,英偉達(dá)將CUDA與AI計(jì)算完美融合,英偉達(dá)的騰飛才真正開始。如今,CUDA連接了全球數(shù)百萬開發(fā)者,使英偉達(dá)GPU成為AI時(shí)代事實(shí)上的"計(jì)算貨幣",其護(hù)城河之深,已難以用單純的晶體管數(shù)量或浮點(diǎn)算力來衡量。這也能說明為何國(guó)產(chǎn)GPU公司很難實(shí)現(xiàn)快速超車。
03
技術(shù)爭(zhēng)鋒:HBM、架構(gòu)迭代與性能軍備競(jìng)賽
驅(qū)動(dòng)GPU產(chǎn)業(yè)以"黃氏定律"速度(顯示芯片性能每6個(gè)月提升1倍,AI算力在8年內(nèi)實(shí)現(xiàn)千倍增長(zhǎng))前進(jìn)的,是持續(xù)不斷的技術(shù)創(chuàng)新與白熱化的性能軍備競(jìng)賽。筆者梳理發(fā)現(xiàn),當(dāng)前的技術(shù)角逐主要集中在3個(gè)關(guān)鍵維度:
1、存儲(chǔ)技術(shù)的躍遷
算力的爆炸式增長(zhǎng),不僅需要強(qiáng)大的"引擎"(GPU核心),更依賴于能夠?qū)崟r(shí)"喂飽"引擎數(shù)據(jù)的"高速糧道"。自2017年起,英偉達(dá)便在高端AIGPU(如A100、H100)中率先采用HBM(高頻寬存儲(chǔ)器)技術(shù)。
這與傳統(tǒng)的GDDR(Graphics Double Data Rate)內(nèi)存有本質(zhì)不同:GDDR作為傳統(tǒng)的內(nèi)存技術(shù),提供了平衡的性能和成本,適用于廣泛的圖形應(yīng)用,而HBM則更專注于提供高性能、高帶寬以及更能效的解決方案,適用于對(duì)數(shù)據(jù)傳輸速度和能效要求更高的領(lǐng)域。在結(jié)構(gòu)上,GDDR是一種傳統(tǒng)的圖形內(nèi)存,通常以單個(gè)芯片的形式存在,它的設(shè)計(jì)比較扁平,內(nèi)存芯片以并行方式連接到圖形處理單元(GPU)。HBM通過3D堆疊、硅通孔(TSV)等尖端封裝工藝,將多層DRAM芯片像蓋樓一樣垂直堆疊,并與GPU邏輯芯片通過硅中介層緊密集成。這種設(shè)計(jì)帶來了革命性優(yōu)勢(shì):HBM擁有數(shù)倍于GDDR的帶寬和更低的功耗,但代價(jià)是結(jié)構(gòu)極度復(fù)雜、成本高昂。
![]()
圖:H200,英偉達(dá)官網(wǎng)
以英偉達(dá)2023年底發(fā)布的H200 GPU為例,它首次搭載HBM3e,顯存帶寬高達(dá)4.8TB/秒,用于700億參數(shù)大模型推理時(shí),速度是前代H100的1.9倍,能耗卻降低一半。這清晰表明,突破"內(nèi)存墻"是算力持續(xù)進(jìn)化的生死線。
2、架構(gòu)平臺(tái)的高速代際飛躍
GPU行業(yè)中,很多企業(yè)把英偉達(dá)當(dāng)成終極目標(biāo),但筆者看來,一個(gè)殘酷的事實(shí)是,這個(gè)終極目標(biāo)并非原地不動(dòng)等待超越,而是仍在向前狂奔,保持著約兩年一次架構(gòu)升級(jí)的殘酷節(jié)奏。其下一代平臺(tái)"Rubin"已提上日程,計(jì)劃于2026年量產(chǎn)。Rubin不再僅僅是單一的GPU芯片,而是一個(gè)整合了Rubin GPU、專為AI推理設(shè)計(jì)的Vera CPU、新一代NV Link交換機(jī)芯片、高速網(wǎng)卡的龐大計(jì)算系統(tǒng)。其中,Rubin GPU的關(guān)鍵指標(biāo)呈現(xiàn)跨代躍升:FP4推理性能預(yù)計(jì)達(dá)到當(dāng)前Blackwell架構(gòu)的5倍。這場(chǎng)競(jìng)爭(zhēng)已從單一的"芯片對(duì)決"升級(jí)為"系統(tǒng)平臺(tái)戰(zhàn)爭(zhēng)",比拼的是從芯片到集群的全棧優(yōu)化能力。
3、圖形與計(jì)算的雙重挑戰(zhàn)
盡管AI計(jì)算是當(dāng)前最大的風(fēng)口,但圖形顯示功能本身的技術(shù)壁壘實(shí)際上更為森嚴(yán)。硬件結(jié)構(gòu)上,一顆完整的GPU需要集成光柵化、紋理貼圖、光線追蹤等為圖形專門優(yōu)化的硬件單元,其復(fù)雜程度遠(yuǎn)超專注于矩陣計(jì)算的AI芯片;算法上,圖形處理涉及計(jì)算機(jī)圖形學(xué),需要融合物理模擬、光學(xué)渲染等多學(xué)科知識(shí),算法難度極高。
因此,能夠同時(shí)駕馭高性能圖形渲染與通用AI計(jì)算的"全功能GPU",代表了芯片設(shè)計(jì)領(lǐng)域的皇冠明珠,這也是諸多國(guó)產(chǎn)GPU廠商將"全功能"作為核心戰(zhàn)略方向的原因。
當(dāng)國(guó)際巨頭在技術(shù)前沿高歌猛進(jìn),用一代代產(chǎn)品定義著算力標(biāo)準(zhǔn)時(shí),一個(gè)關(guān)鍵問題擺在全球產(chǎn)業(yè)面前:在這條被巨頭劃定的賽道上,后來者還有機(jī)會(huì)嗎?中國(guó)的答案,正在上海張江的實(shí)驗(yàn)室里、在資本市場(chǎng)的鑼聲中、在一張張累計(jì)虧損數(shù)十億的財(cái)務(wù)報(bào)表背后,悄然書寫。從技術(shù)追隨到生態(tài)破局,國(guó)產(chǎn)GPU的征途,遠(yuǎn)比想象中更加艱難,也更加波瀾壯闊,我們下篇繼續(xù)分析。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.