關于中國科技的發(fā)展,我最近聽到一個觀點,那就是在這兩年,中國科技的發(fā)展在從以前的追趕式開始進步到原創(chuàng)并跑階段。
以前是西方有的,我們也要有,西方封鎖我,那么我們一定要把西方封鎖的技術搞出來,帶有一種頭懸梁錐刺股,破釜沉舟式的“悲壯”意味,比如我們在中國工業(yè)發(fā)展的不少領域,都聽到過“爭氣機”的說法,
一般都是我們沒有這項技術,然后我們去買人家不賣,或者故意出高價,還諷刺我們永遠做不出來,最終我們奮發(fā)圖強,一舉做出了這項技術。
這樣的故事相信大家一定看到過類似的版本。
在以前我們想的也是更多是先填補技術國內空白,先把這個東西做出來,但現(xiàn)在情況不一樣了,中國科技已經(jīng)開始有原創(chuàng)領先科技爆發(fā)的態(tài)勢。
正如DeepSeek創(chuàng)始人梁文鋒說“中國AI不可能永遠處在跟隨的位置。我們經(jīng)常說中國AI和美國有一兩年差距,但真實的gap是原創(chuàng)和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。”
國內新一代科技人才已經(jīng)有了這個覺悟。
過去的幾個月,從DeepSeek到宇樹科技國產機器狗等國產新技術不斷的涌現(xiàn),而且都是世界級的創(chuàng)新成果。
前幾天我看美國財政部長當?shù)貢r間4月2日接受采訪的視頻,他說美國科技七巨頭(英偉達,亞馬遜,谷歌,特斯拉,蘋果,微軟,Meta)的股價大跌是因為deepseek的發(fā)布,而不是美國政府的貿易保護主義。
不管他說的對不對,
能被美國人拿來當成美國科技企業(yè)股價大跌的理由,說明了至少兩點,
一是中國AI技術進步是得到了對手肯定的,
二是AI技術真的非常重要
其實對應美國的科技七巨頭的話,我們也可以列出國內的科技七巨頭,我腦子里最先冒出來的是華為,大疆,DeepSeek三個,
當然不管怎么列舉,華為肯定會是其中之一,
另外就是不管怎么列舉,國產科技七巨頭也肯定都在AI方面有不少研究和投入。
到2025年的今天, AI已經(jīng)是確定性的趨勢,日常生活中已經(jīng)有大量想不到的AI應用。
1:AI在讓人類生活更方便
我看到一個有意思的事就是燒烤店數(shù)簽子算錢,不需要服務員一根根的去數(shù)了還容易數(shù)錯,直接拿手機拍照就能自動識別有多少根簽子。
2:AI在創(chuàng)造更多的娛樂方式
在過去的一年,你有沒有在不知不覺中發(fā)現(xiàn)在短視頻平臺,在AI大模型APP里面,讓圖片里人物動起來跳個舞之類的特效已經(jīng)越來越多了?這其實也是AI技術在你不知不覺中進步,在之前就沒有這個功能。
現(xiàn)在各種大模型APP里面有很多可以對話的智能體,還可以克隆你的聲音,很有意思。
3:AI在增加人類的安全性和存活概率
再比如汽車的自動駕駛,華為發(fā)布的尊界都已經(jīng)是按照L3來設計了,安全性又上了一個臺階,就看國家法律法規(guī)什么時候跟進L3了。
其實盡管不要過分依賴智駕一直是個社交媒體上面的熱門話題,但是常識告訴我們,過去的幾年智駕其實拯救了不少生命,尤其是在智駕車型普及很高的中國,這個數(shù)量我相信是全球最高的。
4:AI關系到國家安全和生存
原因很簡單,因為AI可以用于軍事和武器,
舉個例子,下圖是《終結者4》電影里面攜帶武器,可實現(xiàn)無人駕駛和自主攻擊摩托車,這個電影是2009年上映的,當時覺得這一幕很科幻,
但是我們現(xiàn)在再看的話,已經(jīng)從思想上并不覺得這是科幻片了,而是覺得這已經(jīng)是在當前的技術上可以實現(xiàn)的東西。
![]()
因此我們更進一步,正因為AI關系到我們生活的方方面面,所以AI技術的進步與否就直接關系到一個公司乃至一個國家財富的多少,上面美國財政部長說DeepSeek直接影響了美國科技七巨頭的股價就是例子,那可是實打實的錢啊。
由于AI技術如此重要,因此我們自然也會關心國產AI技術的進步,那就是一個AI應用(大模型),一個AI軟硬件基礎設施。
我們先說大模型部分,大模型其實可以看成是應用,
2024年年底和2025年初deepseek陸續(xù)發(fā)布了V3和R1,火爆了全球,代表的是成本的下降,可以說在deepseek之前,人類的算力需求增長和成本是可怕的規(guī)模,以致于市場給了類似英偉達極高的預期,英偉達的市值在2025年1月7日這天創(chuàng)下了3.75萬億美元的歷史巔峰。
而有了降成本的deepseek之后,使得市場終于降低了對英偉達的預期,
注意我并不認為算力總需求會下降,只是會從爆發(fā)增長走向正常增長。
舉個例子,在其他因素不變的情況下,參數(shù)量多少和算力需求是成正比的,Deepseek 發(fā)布的V3和R1滿血版都是671B的參數(shù),也就是6710億個參數(shù),而上一代版本,2024年5月發(fā)布的V2的參數(shù)量就只有2360億,總體還是增長的,而Deepseek更為復雜的下一代參數(shù)量還會更大,
再比如deepseek 開源大模型展現(xiàn)出來的良好性能,將會刺激千行百業(yè)進行部署基于deepseek的推理應用,刺激對算力的需求。
所以Deepseek的出現(xiàn)使得AI算力需求增長進入更為良性的軌道,更低的成本將大大推動AI的普及,總算力需求仍然是增長的。
這就跟所有的產業(yè)發(fā)展是軌跡一樣的,
當年九十年代的大哥大一部就得上萬元人民幣,后來隨著成本降低,單臺價格下降了90%以上,普通人也逐漸買得起了,市場的總規(guī)模并沒有縮減,是不斷增長的。
再說AI基礎設施部分,這部分我不得不說,華為扛起了中國AI基礎設施技術發(fā)展的重任。
強大的AI社會需要強大的AI基礎設施,在美國這個基礎設施供應商是英偉達和亞馬遜云,英偉達提供底層硬件,亞馬遜以云的形式提供算力服務。
在中國的話,最大的能對標英偉達的廠家就是華為了,同時華為云也是中國最大的云服務供應商之一,為政府和千行百業(yè)提供算力服務。
美國政府一直在為自家企業(yè)保駕護航,所以早早的就盯著華為,
2019年6月把華為列入實體清單;
又在2020年9月就禁止了全球芯片代工廠家為華為代工。
當然華為在自己努力下,終于實現(xiàn)了芯片制造的自主供應,
但芯片工藝制程的限制,還是影響了中國AI硬件的單卡算力進步,所以論單卡算力,華為的昇騰目前比不上英偉達。
也正是因為如此,所以美國從2022年底開始逐漸禁售了英偉達的H100/H800/A100/A800等高端算力芯片。
但是華為并沒有放棄,而是采取多路徑的方式進行技術攻關,
一方面是在半導體設備研發(fā)制造方面有所動作,今年3月底在上海召開的 SEMICON China 2025半導體展會上公開亮相的某半導體生產設備公司,其各種以“山”命名的設備,加上含有“凱旋歸來”意味的名字,讓廣大網(wǎng)友一下子就猜出了其血統(tǒng)。
另一方面華為也在AI基礎設施技術方面不斷探索進步,
華為云在4月10日發(fā)布了CloudMatrix 384超節(jié)點技術,成功實現(xiàn)超節(jié)點技術商用,在當下先進工藝制程尚未突破的情況下,這也是華為持續(xù)追趕英偉達的關鍵。
同時通過云服務的形式,向國內各行各業(yè)提供超節(jié)點技術算力,
因為隨著企業(yè)對AI應用需求的規(guī)模越來越大,那么需要的算力就會增加,企業(yè)會走向千卡甚至萬卡數(shù)據(jù)中心算力集群,
而這個集群內各個節(jié)點的通信就成為發(fā)揮性能的瓶頸,這就好比一支龐大的軍隊,如果各個單位之間不能及時有效的通信,那么戰(zhàn)斗力就會大打折扣。
想象一下,如果算力集群中一張算力卡已經(jīng)完成了計算任務,但是數(shù)據(jù)卻不能快速地流動到其他算力卡進行計算,導致大量算力卡在閑置和等待,這就讓集群性能不能充分發(fā)揮。
什么是超節(jié)點?
當前業(yè)界一臺算力服務器通常是8張算力卡,這一臺服務器就稱為一個節(jié)點,在一臺服務器以內的8張卡之間的通信速度是非常快的,
而相比之下服務器與服務器之間的通信速度則慢的多,其速度相差甚至能夠達到10倍以上,也就是說一張算力卡和同一個服務器里的另一張算力卡,以及和另一個服務器的算力卡通信速度是天壤之別。
不僅僅是算力卡之間,算力卡和內存之間的通信也是一樣的,
和同一個服務器節(jié)點里面的內存通信,速度要比和跨服務器的內存通信要快的多。
所以如果能用高速通信技術把更多張算力卡,內存融合在一起,成為一個超節(jié)點,超節(jié)點內的算力卡,內存都可以實現(xiàn)高速互聯(lián)和通信,這就能大大的提高算力集群的性能。
當然,這不僅需要有深厚的通信技術積累,也需要有軟件來進行大規(guī)模協(xié)同。
英偉達已經(jīng)率先在2024年3月發(fā)布了NVL72超節(jié)點,可以把72張訓練卡組成一個超節(jié)點。
而華為云在4月10日發(fā)布的CloudMatrix 384超節(jié)點技術則更進一步,可以實現(xiàn)384張昇騰算力卡成為一個超節(jié)點,這不僅是中國最大的商用超節(jié)點,而且超節(jié)點規(guī)模比英偉達的NVL72更大,算力更強,性能比NVL72更優(yōu)。
或者換句話說,它是目前已商用的超節(jié)點中,單體規(guī)模全球最大,有效算力全球最高。
超節(jié)點充分發(fā)揮了華為在通信領域的技術積累和優(yōu)勢,使其能在國內率先突破和領先,畢竟華為是全球領先的通信廠家。
目前國內在AI基礎設施的趕超方向我認為是比較明確的,
那就是近兩年朝超節(jié)點方向發(fā)展,未來則單卡算力會發(fā)力,原因如下:
其一隨著算力的增長,國內需求千卡集群,萬卡集群的數(shù)量越來越多,而大規(guī)模集群必然會涉及到高速通信互聯(lián),以及網(wǎng)絡負載算法等通信相關的技術,在這些技術方面中國目前是沒有限制的,尤其對華為而言這還是強項,超節(jié)點會符合國內算力需求增長的需要。
其二單卡算力主要和芯片工藝制程相關,因此在生產設備突破后會迎來一個躍升,但這個突破的時間會在未來幾年,到時候單卡算力的提升會比現(xiàn)在更快。
對于國內千行百業(yè)的企業(yè)而言,除了少數(shù)具備極強IT技術和運維能力的頭部客戶,大部分企業(yè)都會選擇類似華為昇騰云服務這樣的云廠家,而非選擇自建數(shù)據(jù)中心。
原因很簡單,可以總結為四點:
1:超節(jié)點在提升性能的同時,也有更大的算力規(guī)模,自建的話一次性投入成本高,而在使用云服務時,你既可以選擇租用一個超節(jié)點,也可以選擇只租用超節(jié)點的一部分,相比自己購買更為靈活。
2:超節(jié)點更為復雜的技術架構也意味著對運維團隊的技術能力要求更高,需要解決的各種故障和運維問題更復雜,
對于一般企業(yè)而言,顯然沒有必要維持一個高成本的運維專家團隊,還是直接把底層軟硬件的運維和穩(wěn)定性直接交給云服務廠家比較簡單。
例如華為的昇騰云服務可以實現(xiàn)萬億參數(shù)模型長達40天的長穩(wěn)訓練,遠優(yōu)于業(yè)界平均無中斷2.8天的水平,故障實現(xiàn)從業(yè)界平均的60分鐘恢復縮短到10分鐘內恢復,不需要從頭重新訓練。
3:現(xiàn)在國內云服務廠家是算力節(jié)點在地理布局上已經(jīng)非常完善
例如華為云在全國就有3+N+X云數(shù)據(jù)中心,其中這個三是指內蒙烏蘭察布,貴州貴安,安徽蕪湖三個最大的數(shù)據(jù)中心,部署了幾萬張昇騰卡的算力, 需要超節(jié)點服務時可以分鐘級開通昇騰云服務,
而華為云其余N+X數(shù)據(jù)中心也是遍布全國,在服務時延和數(shù)據(jù)傳輸成本上都可以就近,從而得到低成本的良好體驗。
4:國產AI硬件的進步速度將會加速
這是我的一個判斷,因為從2018年以來的七年,在美國在半導體領域的強力狙擊下,中國半導體產業(yè)不得不開始補短板,強基礎的艱難過程,因此國產硬件性能的進步也放緩了。
而在七年后的今天,基礎實力已經(jīng)大大增強,國產半導體生產設備,材料技術已經(jīng)不可同日而語,可以說有一種已經(jīng)在突破前夜的感覺。
以華為云為代表的國產超節(jié)點技術今年的率先商用,其他國內廠家預計也遲早會跟進,因此可以預期的是國產AI硬件的技術進步將會加速。
而選擇云服務則不會面臨技術快速進步下,出現(xiàn)硬件過時的問題,
你需要多少算力云服務廠家就給你多少,你不需要去關心底層的硬件資源,這也省去了若自建可能會導致硬件資源因為過時而閑置的煩惱。
從目前的情況看,華為在外部壓力下,成功的實現(xiàn)了兩個重要的成果:
在國內人工智能需求猛增的情況下確保了AI軟硬件基礎設施的交付,使得國內的算力需求方可以快速的獲得華為云提供的算力服務,避免了國內的算力短缺,我們今天在國內能夠大量的享受和使用各種AI應用帶來的好處,華為是做了很大貢獻的;
另一個重要成果就是在實現(xiàn)了國內AI基礎設施技術的持續(xù)進步,今年華為云超節(jié)點技術的商用就讓國內的算力基礎設施服務進入了更高性能的時代。
而展望未來,我可以比較確定的說,超節(jié)點之后的下一次國產AI基礎設施技術的進步,也會是來自華為。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.