網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

DeepSeek和國產機器狗之后，華為云超節(jié)點也來了

2025-04-11 08:37:02　來源: 寧南山

廣東舉報

分享至

關于中國科技的發(fā)展，我最近聽到一個觀點，那就是在這兩年，中國科技的發(fā)展在從以前的追趕式開始進步到原創(chuàng)并跑階段。

以前是西方有的，我們也要有，西方封鎖我，那么我們一定要把西方封鎖的技術搞出來，帶有一種頭懸梁錐刺股，破釜沉舟式的“悲壯”意味，比如我們在中國工業(yè)發(fā)展的不少領域，都聽到過“爭氣機”的說法，

一般都是我們沒有這項技術，然后我們去買人家不賣，或者故意出高價，還諷刺我們永遠做不出來，最終我們奮發(fā)圖強，一舉做出了這項技術。

這樣的故事相信大家一定看到過類似的版本。

在以前我們想的也是更多是先填補技術國內空白，先把這個東西做出來，但現(xiàn)在情況不一樣了，中國科技已經(jīng)開始有原創(chuàng)領先科技爆發(fā)的態(tài)勢。

正如DeepSeek創(chuàng)始人梁文鋒說“中國AI不可能永遠處在跟隨的位置。我們經(jīng)常說中國AI和美國有一兩年差距，但真實的gap是原創(chuàng)和模仿之差。如果這個不改變，中國永遠只能是追隨者，所以有些探索也是逃不掉的。”

國內新一代科技人才已經(jīng)有了這個覺悟。

過去的幾個月，從DeepSeek到宇樹科技國產機器狗等國產新技術不斷的涌現(xiàn)，而且都是世界級的創(chuàng)新成果。

前幾天我看美國財政部長當?shù)貢r間4月2日接受采訪的視頻，他說美國科技七巨頭（英偉達，亞馬遜，谷歌，特斯拉，蘋果，微軟，Meta）的股價大跌是因為deepseek的發(fā)布，而不是美國政府的貿易保護主義。

不管他說的對不對，

能被美國人拿來當成美國科技企業(yè)股價大跌的理由，說明了至少兩點，

一是中國AI技術進步是得到了對手肯定的，

二是AI技術真的非常重要

其實對應美國的科技七巨頭的話，我們也可以列出國內的科技七巨頭，我腦子里最先冒出來的是華為，大疆，DeepSeek三個，

當然不管怎么列舉，華為肯定會是其中之一，

另外就是不管怎么列舉，國產科技七巨頭也肯定都在AI方面有不少研究和投入。

到2025年的今天, AI已經(jīng)是確定性的趨勢，日常生活中已經(jīng)有大量想不到的AI應用。

1：AI在讓人類生活更方便

我看到一個有意思的事就是燒烤店數(shù)簽子算錢，不需要服務員一根根的去數(shù)了還容易數(shù)錯，直接拿手機拍照就能自動識別有多少根簽子。

2：AI在創(chuàng)造更多的娛樂方式

在過去的一年，你有沒有在不知不覺中發(fā)現(xiàn)在短視頻平臺，在AI大模型APP里面，讓圖片里人物動起來跳個舞之類的特效已經(jīng)越來越多了？這其實也是AI技術在你不知不覺中進步，在之前就沒有這個功能。

現(xiàn)在各種大模型APP里面有很多可以對話的智能體，還可以克隆你的聲音，很有意思。

3：AI在增加人類的安全性和存活概率

再比如汽車的自動駕駛，華為發(fā)布的尊界都已經(jīng)是按照L3來設計了，安全性又上了一個臺階，就看國家法律法規(guī)什么時候跟進L3了。

其實盡管不要過分依賴智駕一直是個社交媒體上面的熱門話題，但是常識告訴我們，過去的幾年智駕其實拯救了不少生命，尤其是在智駕車型普及很高的中國，這個數(shù)量我相信是全球最高的。

4：AI關系到國家安全和生存

原因很簡單，因為AI可以用于軍事和武器，

舉個例子，下圖是《終結者4》電影里面攜帶武器，可實現(xiàn)無人駕駛和自主攻擊摩托車，這個電影是2009年上映的，當時覺得這一幕很科幻，

但是我們現(xiàn)在再看的話，已經(jīng)從思想上并不覺得這是科幻片了，而是覺得這已經(jīng)是在當前的技術上可以實現(xiàn)的東西。

因此我們更進一步，正因為AI關系到我們生活的方方面面，所以AI技術的進步與否就直接關系到一個公司乃至一個國家財富的多少，上面美國財政部長說DeepSeek直接影響了美國科技七巨頭的股價就是例子，那可是實打實的錢啊。

由于AI技術如此重要，因此我們自然也會關心國產AI技術的進步，那就是一個AI應用（大模型），一個AI軟硬件基礎設施。

我們先說大模型部分，大模型其實可以看成是應用，

2024年年底和2025年初deepseek陸續(xù)發(fā)布了V3和R1，火爆了全球，代表的是成本的下降，可以說在deepseek之前，人類的算力需求增長和成本是可怕的規(guī)模，以致于市場給了類似英偉達極高的預期，英偉達的市值在2025年1月7日這天創(chuàng)下了3.75萬億美元的歷史巔峰。

而有了降成本的deepseek之后，使得市場終于降低了對英偉達的預期，

注意我并不認為算力總需求會下降，只是會從爆發(fā)增長走向正常增長。

舉個例子，在其他因素不變的情況下，參數(shù)量多少和算力需求是成正比的，Deepseek 發(fā)布的V3和R1滿血版都是671B的參數(shù)，也就是6710億個參數(shù)，而上一代版本，2024年5月發(fā)布的V2的參數(shù)量就只有2360億，總體還是增長的，而Deepseek更為復雜的下一代參數(shù)量還會更大，

再比如deepseek 開源大模型展現(xiàn)出來的良好性能，將會刺激千行百業(yè)進行部署基于deepseek的推理應用，刺激對算力的需求。

所以Deepseek的出現(xiàn)使得AI算力需求增長進入更為良性的軌道，更低的成本將大大推動AI的普及，總算力需求仍然是增長的。

這就跟所有的產業(yè)發(fā)展是軌跡一樣的，

當年九十年代的大哥大一部就得上萬元人民幣，后來隨著成本降低，單臺價格下降了90%以上，普通人也逐漸買得起了，市場的總規(guī)模并沒有縮減，是不斷增長的。

再說AI基礎設施部分，這部分我不得不說，華為扛起了中國AI基礎設施技術發(fā)展的重任。

強大的AI社會需要強大的AI基礎設施，在美國這個基礎設施供應商是英偉達和亞馬遜云，英偉達提供底層硬件，亞馬遜以云的形式提供算力服務。

在中國的話，最大的能對標英偉達的廠家就是華為了，同時華為云也是中國最大的云服務供應商之一，為政府和千行百業(yè)提供算力服務。

美國政府一直在為自家企業(yè)保駕護航，所以早早的就盯著華為，

2019年6月把華為列入實體清單；

又在2020年9月就禁止了全球芯片代工廠家為華為代工。

當然華為在自己努力下，終于實現(xiàn)了芯片制造的自主供應，

但芯片工藝制程的限制，還是影響了中國AI硬件的單卡算力進步，所以論單卡算力，華為的昇騰目前比不上英偉達。

也正是因為如此，所以美國從2022年底開始逐漸禁售了英偉達的H100/H800/A100/A800等高端算力芯片。

但是華為并沒有放棄，而是采取多路徑的方式進行技術攻關，

一方面是在半導體設備研發(fā)制造方面有所動作，今年3月底在上海召開的 SEMICON China 2025半導體展會上公開亮相的某半導體生產設備公司，其各種以“山”命名的設備，加上含有“凱旋歸來”意味的名字，讓廣大網(wǎng)友一下子就猜出了其血統(tǒng)。

另一方面華為也在AI基礎設施技術方面不斷探索進步，

華為云在4月10日發(fā)布了CloudMatrix 384超節(jié)點技術，成功實現(xiàn)超節(jié)點技術商用，在當下先進工藝制程尚未突破的情況下，這也是華為持續(xù)追趕英偉達的關鍵。

同時通過云服務的形式，向國內各行各業(yè)提供超節(jié)點技術算力，

因為隨著企業(yè)對AI應用需求的規(guī)模越來越大，那么需要的算力就會增加，企業(yè)會走向千卡甚至萬卡數(shù)據(jù)中心算力集群，

而這個集群內各個節(jié)點的通信就成為發(fā)揮性能的瓶頸，這就好比一支龐大的軍隊，如果各個單位之間不能及時有效的通信，那么戰(zhàn)斗力就會大打折扣。

想象一下，如果算力集群中一張算力卡已經(jīng)完成了計算任務，但是數(shù)據(jù)卻不能快速地流動到其他算力卡進行計算，導致大量算力卡在閑置和等待，這就讓集群性能不能充分發(fā)揮。

什么是超節(jié)點？

當前業(yè)界一臺算力服務器通常是8張算力卡，這一臺服務器就稱為一個節(jié)點，在一臺服務器以內的8張卡之間的通信速度是非常快的，

而相比之下服務器與服務器之間的通信速度則慢的多，其速度相差甚至能夠達到10倍以上，也就是說一張算力卡和同一個服務器里的另一張算力卡，以及和另一個服務器的算力卡通信速度是天壤之別。

不僅僅是算力卡之間，算力卡和內存之間的通信也是一樣的，

和同一個服務器節(jié)點里面的內存通信，速度要比和跨服務器的內存通信要快的多。

所以如果能用高速通信技術把更多張算力卡，內存融合在一起，成為一個超節(jié)點，超節(jié)點內的算力卡，內存都可以實現(xiàn)高速互聯(lián)和通信，這就能大大的提高算力集群的性能。

當然，這不僅需要有深厚的通信技術積累，也需要有軟件來進行大規(guī)模協(xié)同。

英偉達已經(jīng)率先在2024年3月發(fā)布了NVL72超節(jié)點，可以把72張訓練卡組成一個超節(jié)點。

而華為云在4月10日發(fā)布的CloudMatrix 384超節(jié)點技術則更進一步，可以實現(xiàn)384張昇騰算力卡成為一個超節(jié)點，這不僅是中國最大的商用超節(jié)點，而且超節(jié)點規(guī)模比英偉達的NVL72更大，算力更強，性能比NVL72更優(yōu)。

或者換句話說，它是目前已商用的超節(jié)點中，單體規(guī)模全球最大，有效算力全球最高。

超節(jié)點充分發(fā)揮了華為在通信領域的技術積累和優(yōu)勢，使其能在國內率先突破和領先，畢竟華為是全球領先的通信廠家。

目前國內在AI基礎設施的趕超方向我認為是比較明確的，

那就是近兩年朝超節(jié)點方向發(fā)展，未來則單卡算力會發(fā)力，原因如下：

其一隨著算力的增長，國內需求千卡集群，萬卡集群的數(shù)量越來越多，而大規(guī)模集群必然會涉及到高速通信互聯(lián)，以及網(wǎng)絡負載算法等通信相關的技術，在這些技術方面中國目前是沒有限制的，尤其對華為而言這還是強項，超節(jié)點會符合國內算力需求增長的需要。

其二單卡算力主要和芯片工藝制程相關，因此在生產設備突破后會迎來一個躍升，但這個突破的時間會在未來幾年，到時候單卡算力的提升會比現(xiàn)在更快。

對于國內千行百業(yè)的企業(yè)而言，除了少數(shù)具備極強IT技術和運維能力的頭部客戶，大部分企業(yè)都會選擇類似華為昇騰云服務這樣的云廠家，而非選擇自建數(shù)據(jù)中心。

原因很簡單，可以總結為四點：

1：超節(jié)點在提升性能的同時，也有更大的算力規(guī)模，自建的話一次性投入成本高，而在使用云服務時，你既可以選擇租用一個超節(jié)點，也可以選擇只租用超節(jié)點的一部分，相比自己購買更為靈活。

2：超節(jié)點更為復雜的技術架構也意味著對運維團隊的技術能力要求更高，需要解決的各種故障和運維問題更復雜，

對于一般企業(yè)而言，顯然沒有必要維持一個高成本的運維專家團隊，還是直接把底層軟硬件的運維和穩(wěn)定性直接交給云服務廠家比較簡單。

例如華為的昇騰云服務可以實現(xiàn)萬億參數(shù)模型長達40天的長穩(wěn)訓練，遠優(yōu)于業(yè)界平均無中斷2.8天的水平，故障實現(xiàn)從業(yè)界平均的60分鐘恢復縮短到10分鐘內恢復，不需要從頭重新訓練。

3：現(xiàn)在國內云服務廠家是算力節(jié)點在地理布局上已經(jīng)非常完善

例如華為云在全國就有3+N+X云數(shù)據(jù)中心，其中這個三是指內蒙烏蘭察布，貴州貴安，安徽蕪湖三個最大的數(shù)據(jù)中心，部署了幾萬張昇騰卡的算力，需要超節(jié)點服務時可以分鐘級開通昇騰云服務，

而華為云其余N+X數(shù)據(jù)中心也是遍布全國，在服務時延和數(shù)據(jù)傳輸成本上都可以就近，從而得到低成本的良好體驗。

4：國產AI硬件的進步速度將會加速

這是我的一個判斷，因為從2018年以來的七年，在美國在半導體領域的強力狙擊下，中國半導體產業(yè)不得不開始補短板，強基礎的艱難過程，因此國產硬件性能的進步也放緩了。

而在七年后的今天，基礎實力已經(jīng)大大增強，國產半導體生產設備，材料技術已經(jīng)不可同日而語，可以說有一種已經(jīng)在突破前夜的感覺。

以華為云為代表的國產超節(jié)點技術今年的率先商用，其他國內廠家預計也遲早會跟進，因此可以預期的是國產AI硬件的技術進步將會加速。

而選擇云服務則不會面臨技術快速進步下，出現(xiàn)硬件過時的問題，

你需要多少算力云服務廠家就給你多少，你不需要去關心底層的硬件資源，這也省去了若自建可能會導致硬件資源因為過時而閑置的煩惱。

從目前的情況看，華為在外部壓力下，成功的實現(xiàn)了兩個重要的成果：

在國內人工智能需求猛增的情況下確保了AI軟硬件基礎設施的交付，使得國內的算力需求方可以快速的獲得華為云提供的算力服務，避免了國內的算力短缺，我們今天在國內能夠大量的享受和使用各種AI應用帶來的好處，華為是做了很大貢獻的；

另一個重要成果就是在實現(xiàn)了國內AI基礎設施技術的持續(xù)進步，今年華為云超節(jié)點技術的商用就讓國內的算力基礎設施服務進入了更高性能的時代。

而展望未來，我可以比較確定的說，超節(jié)點之后的下一次國產AI基礎設施技術的進步，也會是來自華為。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.