![]()
今天,A股上演了一場真正的“印鈔狂歡”。
被大家念叨了很久的“國產GPU第一股”——摩爾線程,終于登陸科創板了。
你看這股價,首日一度高開468.78%,開盤價每股650元,市值一度突破3000億元。
![]()
在這波狂歡里,創始人張建中贏麻了,僅直接持股市值就達287.56億。早期投資人也賺得盆滿缽滿。最早的投資人沛縣乾曜累計浮盈高達5825倍。
在2020年12月,和而泰投了摩爾線程3000萬,現在變成了26.68億,5年時間直接漲了近88倍。
資本為什么這么瘋狂?就沖著它腦門上那個全市場最性感的標簽—— “中國版英偉達”。
這可不是瞎貼金。摩爾線程的班底那可是正兒八經的“英偉達嫡系”,張建中更是長期擔任英偉達全球副總裁、中國區總經理。
借助這個熱乎勁,今天我們就來盤一盤,這家被捧上神壇的公司,成色到底怎么樣?
5年4代GPU,最新性能接近英偉達H20
顯卡這玩意兒,如果不談場景只談參數,那就是在耍流氓。
咱們把話說明白點。
搞AI計算,核心指標其實就看三個:算力、顯存、帶寬。
顯存決定了你能處理的模型大小,算力代表著能同時處理多少數據,帶寬則代表固定期限能傳輸多少數據。
如果顯存不夠,大模型直接跟你說拜拜,就像小顯卡跑3A大作直接爆顯存一樣,不講道理。
如果算力和帶寬不夠,那就是老牛拉破車,別人跑完了,你還在那loading。
好,鋪墊完了,咱們來看看摩爾線程。
自2020年成立以來,摩爾線程已推出“蘇堤”、“春曉”、“曲院”、“平湖”四代GPU架構,從第三代曲院開始重心轉向AI計算,最新一代“平湖”GPU于2024年發布,基于該GPU的S5000的最新產品。
看數據,S5000在FP32精度下的算力是32 TFLOPS。同時,平湖架構GPU最大顯存容量推斷為80GB,推斷S5000顯存容量應為80GB,帶寬未知。
這是什么概念?咱們拉出英偉達的GPU看看:A100的FP32算力是19.5,H20是44,H100是67。
單看FP32這一項,S5000一拳打翻了A100,甚至快摸到了H20的尾巴。雖然離H100那種“怪物”還有差距,但看著是不是挺熱血沸騰?
且慢,先別急著開香檳。
上面的參數并不能代表S5000的實際AI算力水平,原因就出在這個“FP32”上。
AI計算中,需要用到不同精度的數據,FP32是其中一種,此外還有FP64、FP16/BF16、FP8、FP4、INT8等多種常見數據類型。
字母后面的數字代表在存儲里占用的字節,數字增大,數據精度評估。FP32能表示小數點后7位左右,FP16能達到小數點后3位左右,INT8能表示-128到127之間的整數。
相應的,數據位數越大,占用內存越大,計算速度也更慢。因此,不同AI任務需要找到最合適的數據類型,像醫學、軍事、科學等領域對誤差比較敏感的,就需要用到FP64數據。
現在的AI大模型,不是在那搞火箭軌道計算,所以不需要那么高的精度。
現在大家為了快,為了省內存,都在搞混合精度。FP16、BF16,甚至FP8(8位浮點)才是現在AI訓練和推理的“主戰場”。
就像你切菜,不需要拿著做眼科手術的手術刀去切,拿著菜刀(FP8/FP16)反而砍得更快。
所以,S5000那個漂亮的FP32數據,在AI領域里,參考價值得打個折。關鍵得看它在FP16或者FP8下的表現。
關于這點,有媒體曾經披露過,據參與S5000產品測試的人士透露,S5000是國內真正對標H100的產品,其FP8計算能力對DeepSeek-V3/R1這樣的MoE大模型訓練“是個絕配”。
但由于相關信息較少,摩爾線程S5000的實際表現仍未可知。
再看看隔壁的友商們,那也是卷得飛起。
華為昇騰910C NPU目前公布的BF16/FP16總算力達752 TFLOPS,超過了英偉達H20和A100,但不到H100的一半,片上內存(可簡單類比顯存)和帶寬與H100基本在同一水平。
寒武紀目前在售思元590芯片,FP16算力為256TFLOPS,接近A100水平。沐曦集成未公布數據,僅表示曦云C500和C550兩款GPU在FP16/BF16指標上,處于英偉達A100的算力區間。
不過,也有行業內部人士稱,在實際訓練推理環境中,摩爾線程等國產AI計算卡的紙面參數算力往往需要打個折扣。
必須承認,單看指標,摩爾線程離英偉達確實還有很長的路要跑。
但這不重要,重要的是它還在跑。在他們身上,我們把國產GPU死磕到底的那股勁兒。只要還在往前拱,這件事就有戲。給點耐心,挑戰者永遠值得瑞思拜。
一個S5000集群,貢獻一半以上營收
雖然大家都說摩爾線程是“國產英偉達”,但只要你翻開本本,就會發現兩者的賺錢方式其實大有區別。
比較典型的體現是,英偉達不直接銷售AI智算集群,而摩爾線程主要營收卻來自于集群產品。
今年上半年,摩爾線程共賣出了5個智算集群,其中4個集成512個S4000 GPU,另一個是集成2048個S5000 GPU的集群,這也是摩爾線程賣出的第一個S5000集群。資料顯示,僅這一個S5000集群,就為摩爾線程貢獻了3.97億元營收,占上半年總營收一半以上。
據招股資料顯示,這一個S5000集群的客戶為“重大科技創新平臺”,大概率是某個國家實驗室。值得一提的是,目前國產AI計算卡企業中,華為是絕對龍頭,客戶較為廣泛。寒武紀主要客戶為字節跳動,據行業內人士透露,沐曦集成則主要面向信創GPU市場。
而英偉達之所以不賣AI智算集群的原因,是因為這事的毛利率比賣芯片可差多了。
現在,英偉達賣 GPU 的毛利率高達70%,而賣AI集群的毛利率可就要低很多,因為AI 智算集群的建設和維護也需要大把的錢。
雖然毛利率低,可對于尚處于追趕階段的摩爾線程也不算一個壞的選擇。
因為相比于賣GPU,賣集群更容易做大營收規模。集群本質上就是把一堆GPU連接在一起,共同執行AI任務,賣一個集群就相當于一次性賣出幾百上千甚至更多GPU。
更關鍵的是,賣集群這事也不是誰想干就能干的。
現階段AI模型越做越大,單卡或者多卡組合已經滿足不了訓練需求,同時消費端推理需求暴增,AI大廠和云服務廠商只能建設更大的算力集群來滿足行業需求。
比如,馬斯克的xAI孟菲斯超級集群一期就集成了10萬張H100GPU,亞馬遜的Project Rainier更是集成了近50萬顆自研芯片。
AI計算是一場對速度的極致考驗,每塊GPU類似一段高速公路,這些高速路段并沒有相連,每行駛一段就得出高速然后重新上另一段高速。
于是,當GPU越來越多,就帶了另一個問題:怎么把這些GPU更好地連接起來?
這就引出了建設AI算力集群一個關鍵技術——GPU互聯技術。
英偉達之所以這么牛,是因為它很早就開發出來NVLink技術,相當于把每段高速的連接路段也修成了高速,相鄰的幾張GPU兩兩互通,提升計算速度。目前應用的NVLink5.0技術卡間互聯帶寬高達1.8TB/s,即將推出的6.0技術帶寬將升級至3.6TB/s。
在卡間互聯上,摩爾線程也推出了自研的MT-Link技術,目前最新的MT-Link3.0互聯帶寬達1.3TB/s,介于NVLink4.0(帶寬900GB/s)和5.0之間。招股資料中,摩爾線程表示MT-Link3.0已經達到行業領先水平。
不過,公司也說了,目前摩爾線程最新的平湖GPU架構和S5000 GPU上,用的還是MT-Link2.0技術,片間互聯帶寬為800GB/s。也就是說,新研發的3.0技術還沒應用到產品上。
雖然摩爾線程在GPU互聯技術做得不錯,但其AI集群也面臨著另一個現實挑戰,那就是規模。
一般來說,兩兩互聯的卡數量有著較難突破的物理極限。由于每家廠商采用的互聯結構不同,這個極限并不相同,比如英偉達最新的Blackwell架構支持72個GPU互聯,谷歌TPU在卡間互聯上最多形成4X4X4(即64個TPU)的小立方體,這樣的互聯極限一般被稱為節點。
摩爾線程現有的KUAE2集群技術,每個節點集成8顆模塊化GPU,節點之間采用的InfiniBand/RoCE的網絡方案進行互聯,這兩種都是行業主流網絡互聯方案。KUAE2集群最多可包含1280個節點,最大可支持10240個GPU。
不過,摩爾線程賣出的最大集群僅包含2048張卡。據行業人士透露,在AI計算卡集群上,5000卡是一個關鍵瓶頸,因為集群規模上去后,對電源、電力、散熱以及系統調控等諸多方面都是一個極大的考驗。因此相比于動輒10萬卡、20萬卡互聯的英偉達,摩爾線程的KUAE集群技術仍需要進一步完善及迭代。
雖然技術上還在追趕,離萬卡集群也還有距離。但在國產替代的大潮下,能把千卡級別的集群賣出去,而且真金白銀地賺到錢,已經是一件很了不起的事情了。
只要有人買單,這把火,就還能繼續燒下去。
5年5825倍的造富神話
除了國產GPU追趕英偉達的故事,摩爾線程上市另一個話題便是,造富。
最直接的體現就是創始團隊。公告顯示,發行后張建中直接持股9.4127%,按上市首日的價格,即使不算間接持股,張建中持股市值就高達287.56億元。
最早下場的機構股東同樣賺得盆滿缽滿。
摩爾線程成立三個月,深圳明皓、沛縣乾曜就迅速入局。據摩爾線程公布的法律意見書,沛縣乾曜是以1元的價格入股,投前估值僅1000萬元,沛縣乾曜以190.4762萬元入股,拿到了13.4%股份。同期入股的深圳明皓以35.28元的價格入股,投了8000萬元,拿到了16%股份。
之后,沛縣乾曜以253.60元的價格轉讓了近20萬元的注冊資本,套現約5000萬元。此次發行后沛縣乾曜仍持有1699.87萬股,占總股本的3.6165%,開盤市值為110.48億元,以此計算沛縣乾曜累計浮盈超5825倍。
深圳明皓先后在2021年10月和今年初分別套現了2000萬元和1.57億元,發行后持有1992.27萬股,持股比例為4.2386%,開盤市值為129.49億元,累計浮盈達163倍。
在之后的天使輪中,摩爾線程引入了紅杉資本、聞名泉豐、和而泰、深圳一創、五源啟興五家機構。資料顯示,此輪融資投后估值為16.46億元,和而泰投了3000萬元。此次發行后和而泰持股比例為0.8734%,以開盤價計算持股市值26.68億元,增值了近88倍。
紅杉資本曾多次追投,天使輪、Pre-A輪和B輪合計投入約2.12億元,發行后持股1915.44萬股,持股比例為4.0752%,持股市值124.50億元,增值了近58倍。
不過也有在IPO前提前離場的機構。字節跳動旗下量子躍動在Pre-A輪向摩爾線程投了約5000萬元,今年初將其全部股份轉讓,獲利2.27億元,賺了3.54倍。
即便是在Pre-IPO輪新進入的股東,也賺到了不錯收益。摩爾線程Pre-IPO輪投后估值為298.45億元,開盤市值約3055億元,新股東浮盈9倍以上。
顯然,在國產 GPU 飛速前進的大背景里,這臺造富機器顯然還沒停下。下一段故事,大概才剛剛開始。
文/董武英
PS:如果你對AI大模型領域有獨特的看法,歡迎掃碼加入我們的大模型交流群。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.