![]()
![]()
中國(guó)AI算力產(chǎn)業(yè),正迎來發(fā)展的關(guān)鍵節(jié)點(diǎn)。
隨著AI大模型及應(yīng)用的加速落地,算力基礎(chǔ)設(shè)施建設(shè)的重要性與日俱增,但傳統(tǒng)服務(wù)器堆疊的模式會(huì)帶來算力利用率低、訓(xùn)練中斷等挑戰(zhàn)。
為了解決相關(guān)難題,在近日的華為全聯(lián)接大會(huì)上,華為宣布推出創(chuàng)新的超節(jié)點(diǎn)架構(gòu)。華為董事、ICT BG CEO楊超斌表示,華為超節(jié)點(diǎn)產(chǎn)品可以滿足大型數(shù)據(jù)中心、企業(yè)級(jí)數(shù)據(jù)中心和小型工作站等全場(chǎng)景算力需求,惠及每個(gè)行業(yè)。
硬件之外,中國(guó)AI算力產(chǎn)業(yè)長(zhǎng)期面臨生態(tài)建設(shè)滯后的挑戰(zhàn)。中國(guó)工程院院士、清華大學(xué)計(jì)算機(jī)系教授鄭緯民曾表示,近兩年我們國(guó)內(nèi)的AI芯片取得了很大進(jìn)步,但問題在生態(tài)不太好,現(xiàn)在建成的萬卡系統(tǒng)大多數(shù)都不好用。
生態(tài)是用出來的,作為AI芯片的領(lǐng)跑者,華為將發(fā)展生態(tài)提到了前所未有的戰(zhàn)略高度。同樣在華為全聯(lián)接大會(huì)2025上,據(jù)華為常務(wù)董事汪濤透露,未來5年,華為計(jì)劃每年投入150億人民幣生態(tài)發(fā)展費(fèi)用、1500P開源社區(qū)算力,并投入15000人進(jìn)行生態(tài)平臺(tái)開發(fā)與支持。
具體來說,針對(duì)計(jì)算產(chǎn)業(yè),華為宣布軟件全面開源開放的策略。今年,華為新增開源CANN、Mind系列應(yīng)用使能套件、openPangu等,同時(shí)支持業(yè)界主流的開源社區(qū)和開源項(xiàng)目,支持用戶深度挖掘昇騰潛力,加快自主創(chuàng)新。
在AI芯片領(lǐng)域,英偉達(dá)之所以占據(jù)著如此強(qiáng)大的統(tǒng)治地位,是因?yàn)樗鼧?gòu)筑起了完整的生態(tài)壁壘。如果用戶想遷移至其他品牌,需進(jìn)行不小的成本投入。而現(xiàn)如今隨著昇騰生態(tài)的崛起,毫無疑問為所有企業(yè)提供了更值得信賴的“新選擇”。
![]()
![]()
英偉達(dá)CUDA封閉,華為CANN開源開放
眾所周知,在底層硬件上,昇騰已經(jīng)基于開放的模組和標(biāo)卡,使能伙伴打造了200多款硬件產(chǎn)品,滿足各場(chǎng)景差異化需求。
在硬件開放的基礎(chǔ)上,華為這次全面開源開放CANN,標(biāo)志著這家科技巨頭在構(gòu)建開放AI生態(tài)戰(zhàn)略上邁出了極為關(guān)鍵的一步。
CANN的全稱是“神經(jīng)網(wǎng)絡(luò)異構(gòu)計(jì)算架構(gòu)”(Compute Architecture for Neural Networks),它的角色,是把底層昇騰芯片和上層AI訓(xùn)練框架(如PyTorch、TensorFlow、MindSpore等)連接起來的橋梁,讓開發(fā)者不用關(guān)心芯片細(xì)節(jié)就能調(diào)用底層算力。
與CANN發(fā)揮類似作用的,還有英偉達(dá)的CUDA、AMD的ROCm、摩爾線程的MUSA等等。CUDA讓開發(fā)者可以更高效發(fā)揮GPU性能、降低使用成本,與GPU和NVlink一起構(gòu)成了英偉達(dá)的核心護(hù)城河。
CANN作為昇騰AI基礎(chǔ)軟硬件平臺(tái)的核心組件,于2018年推出,目前已經(jīng)迭代至8.0版本。相比CUDA閉源,此次CANN開源開放,無疑加速了CANN生態(tài)圈建設(shè),開發(fā)者也可以降低對(duì)CUDA生態(tài)的被迫依賴。
據(jù)了解,開發(fā)者普遍希望能夠更加靈活的調(diào)用CANN的各層級(jí)能力,自主的性能調(diào)優(yōu)、問題定位以及算法創(chuàng)新。為此,華為通過分層解耦,支持開發(fā)者從模型、算子、內(nèi)核以及底層資源按需調(diào)用。
比如,昇騰通過圖模式開發(fā),可實(shí)現(xiàn)整圖編譯與下發(fā),降低調(diào)度開銷;也可直接調(diào)用ATB等領(lǐng)域算子,完成模型的性能優(yōu)化;也支持C、C++、Python和模板庫(kù)等多種編程方式,滿足開發(fā)者的各種習(xí)慣;同時(shí),華為開源了底層Runtime能力,開發(fā)者可以細(xì)粒度使用硬件資源。
為更好地匹配開發(fā)需求,CANN構(gòu)建了完備的編程體系,提供Ascend C編程語言和CATLASS模板庫(kù)。同時(shí),通過開放AscendNPU IR,支持Triton、TileLang、FlagTree等Python前端的開源編程框架,可以讓開發(fā)者快速驗(yàn)證創(chuàng)新的想法。
CANN開源開放籌備了兩年多,是今年華為發(fā)展昇騰生態(tài)最核心的“一步棋”。但下定如此大的決心,將核心知識(shí)資產(chǎn)公開,對(duì)于以通信起家的華為并不容易。
華為輪值董事長(zhǎng)徐直軍曾透露,CANN全面開源開放,其實(shí)是在很多客戶的促進(jìn)下形成的。“沒有客戶的促進(jìn),我們的研發(fā)團(tuán)隊(duì)感覺還好得很,而且感覺什么都給客戶做好了挺好的。”
據(jù)他表示,華為習(xí)慣把源代碼捂得死死的,因?yàn)槭呛诵馁Y產(chǎn)。CANN全面開源開放,需要說服大家到底從哪里掙錢。最終,大家達(dá)成一致是打算變現(xiàn)靠昇騰硬件,開源開放是促進(jìn)硬件規(guī)模和硬件的普遍使用,大家都用了、賣得多了,開源開放的錢就掙回來了。
計(jì)算產(chǎn)業(yè)是生態(tài)型產(chǎn)業(yè),開源才能把生態(tài)做大。面對(duì)CUDA生態(tài)的強(qiáng)大慣性,華為堅(jiān)持發(fā)展并開源CANN,不僅能讓昇騰更好用、更易用,也是在推動(dòng)整個(gè)計(jì)算產(chǎn)業(yè)的加速前進(jìn)。
CUDA生態(tài)已經(jīng)發(fā)展了十幾年,如今基于昇騰NPU和昇騰CANN技術(shù)生態(tài)所能實(shí)現(xiàn)的AI應(yīng)用性能,已經(jīng)能夠看齊甚至超越CUDA,已經(jīng)展現(xiàn)出強(qiáng)大的競(jìng)爭(zhēng)力。
![]()
一場(chǎng)關(guān)于生態(tài)話語權(quán)的爭(zhēng)奪戰(zhàn)
除了開源開放自己的產(chǎn)品技術(shù),昇騰也在不斷加強(qiáng)與業(yè)界開源社區(qū)、開源項(xiàng)目的合作。
AI框架是人工智能的操作系統(tǒng),而PyTorch是全球最知名的AI框架之一,由Meta推出,在2016年已經(jīng)開源。PyTorch之外,谷歌的TensorFlow、華為的昇思MindSpore也都已經(jīng)開源。
早在2023年,PyTorch基金會(huì)就正式宣布華為作為Premier會(huì)員加入,這也是中國(guó)首個(gè)、全球第十個(gè)PyTorch基金會(huì)最高級(jí)別會(huì)員,這意味著華為對(duì)PyTorch的技術(shù)貢獻(xiàn)頗大。
為什么自己已經(jīng)有了昇思MindSpore,華為也會(huì)同樣加大對(duì)PyTorch的投入力度呢?這是因?yàn)椋芏嚅_發(fā)者之前就在PyTorch上構(gòu)建業(yè)務(wù),與成熟的開源社區(qū)共建生態(tài),可以大幅降低客戶的使用門檻。
vLLM是最受開發(fā)者歡迎的推理引擎之一,從去年下半年開始,昇騰便開始與vLLM開展技術(shù)和生態(tài)合作。vLLM社區(qū)新版本發(fā)布即支持昇騰,為開發(fā)者提供更多選擇。昇騰團(tuán)隊(duì)還協(xié)助vLLM社區(qū)開發(fā)了硬件后端的插件化特性,降低社區(qū)對(duì)后端支持的維護(hù)成本。
具體來說,在最新版本的vLLM中,開發(fā)者可以基于昇騰與vLLM的全鏈功能,一條命令實(shí)現(xiàn)底層應(yīng)用的無感切換,同時(shí)通過插件化的解決方案獲得混合并行、動(dòng)態(tài)調(diào)度等更多高階特性。
與此同時(shí),昇騰新特性、組件和開發(fā)計(jì)劃等也都將在PyTorch、vLLM、VeRL、SGLang、Triton等開源社區(qū)上首發(fā),讓開發(fā)者第一時(shí)間獲取到最新技術(shù)。
此外,為了讓開發(fā)者快速掌握昇騰開發(fā)技能,華為在昇騰社區(qū)提供完備的知識(shí)體系,比如大家關(guān)心的模組參考設(shè)計(jì)、aclNN算子開發(fā)指導(dǎo)、CATLASS開發(fā)指導(dǎo)等10多個(gè)場(chǎng)景化文檔和100多專題課程。
華為還會(huì)提供分層賦能,比如DR輔導(dǎo)、線下沙龍和線上直播等,讓每一位開發(fā)者都能按需獲取技術(shù)指導(dǎo),激發(fā)開發(fā)者技術(shù)創(chuàng)新。
目前,昇騰已有80多家硬件伙伴打造了200多款產(chǎn)品;昇騰主導(dǎo)開源的60多個(gè)項(xiàng)目,累計(jì)有6500多名核心貢獻(xiàn)開發(fā)者。昇騰也在50多個(gè)開源社區(qū)和開源項(xiàng)目中積極貢獻(xiàn),累計(jì)貢獻(xiàn)37萬行代碼。
開源的核心是共享,開放的本質(zhì)是共贏。無論是加大對(duì)業(yè)界主流的開源社區(qū)和開源項(xiàng)目的支持力度,還是更積極開放地建設(shè)昇騰社區(qū)、培養(yǎng)創(chuàng)新人才,都體現(xiàn)了華為下定決心開放生態(tài),而不是走英偉達(dá)的封閉路線。
這一系列舉措的背后,本質(zhì)實(shí)際上是生態(tài)話語權(quán)的爭(zhēng)奪。選擇開源開放,意味著華為能聯(lián)合更多伙伴一起制定人工智能的行業(yè)標(biāo)準(zhǔn),共享創(chuàng)新成果。
為何華為要如此堅(jiān)定發(fā)展昇騰AI生態(tài)?徐直軍曾解釋到,如果我們一直投資去兼容CUDA,卻無法使用最新版本,如果哪天CUDA生態(tài)兼容不了怎么辦?現(xiàn)在我們的AI,從達(dá)芬奇架構(gòu)到昇騰芯片、再到一切包括所有軟件生態(tài),都不依賴西方的生態(tài)和供應(yīng)鏈。所以長(zhǎng)遠(yuǎn)來考慮的話,要把生態(tài)構(gòu)建起來。
目前在硬件層面上,華為通過超節(jié)點(diǎn)+集群的方式,應(yīng)對(duì)芯片制造工藝受限、單片芯片性能不足的挑戰(zhàn),實(shí)現(xiàn)了算力的強(qiáng)大供給。
相對(duì)來說,AI生態(tài)的建設(shè)是一個(gè)更加緩慢的過程,需要千千萬萬開發(fā)者、合作伙伴一起努力。有數(shù)據(jù)顯示,英偉達(dá)聚集的開發(fā)者達(dá)800萬,而昇騰還不到100萬。
盡管道路漫長(zhǎng)且充滿挑戰(zhàn),但正如徐直軍所說,只要大家心往一處想,都來使用,國(guó)內(nèi)算力生態(tài)一定會(huì)發(fā)展起來。
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.