![]()
過(guò)去幾年,AI產(chǎn)業(yè)的敘事重心始終圍繞兩個(gè)關(guān)鍵詞打轉(zhuǎn)——算力和模型,前者決定了規(guī)模上限,后者決定了智能上限。
但在實(shí)際的工程落地中,影響模型“能否跑得動(dòng)、跑得穩(wěn)、跑得久”的因素,不只有算力性能和模型參數(shù)。位于底層硬件和模型框架之間的計(jì)算架構(gòu),扮演了不可或缺的角色。
在英偉達(dá)的體系里,主要由CUDA擔(dān)綱,把GPU的復(fù)雜性封裝成了一套可調(diào)用、可復(fù)用、可規(guī)模化的計(jì)算體系,幾乎成了事實(shí)上的并行計(jì)算產(chǎn)業(yè)標(biāo)準(zhǔn),形成了一個(gè)封閉、單一廠商主導(dǎo)的技術(shù)生態(tài)。
在華為昇騰的體系里,對(duì)標(biāo)CUDA的是CANN,同樣是一個(gè)承上啟下的計(jì)算架構(gòu):向上對(duì)接昇思MindSpore、PyTorch、TensorFlow等主流AI框架,對(duì)下使NPU為核心的昇騰系列硬件產(chǎn)品。
有別于CUDA的封閉,CANN的主張是開(kāi)源開(kāi)放。特別是在8月份宣布全面開(kāi)源開(kāi)放后,每個(gè)月都有新的組件開(kāi)源。
9月30日,算子庫(kù)、CATLASS算子模板庫(kù)等項(xiàng)目全面開(kāi)源;
10月30日,領(lǐng)域加速庫(kù)、單邊通信庫(kù)等項(xiàng)目開(kāi)源;
11月30日,Ascend C編程語(yǔ)言全面開(kāi)源;
12月30日,運(yùn)行時(shí)、圖引擎、集合通信庫(kù)等項(xiàng)目開(kāi)源,按計(jì)劃實(shí)現(xiàn)CANN 匹配A2/A3版本的全面開(kāi)源開(kāi)放。
由此產(chǎn)生的一個(gè)問(wèn)題是:走封閉路線的CUDA,被視為英偉達(dá)最強(qiáng)大的“護(hù)城河”,CANN為何做出了反向戰(zhàn)略選擇?
01 從“能用”到“敢用”,破解產(chǎn)業(yè)落地的信任天花板
答案藏在產(chǎn)業(yè)一線的“焦慮”中。
在和CTO、開(kāi)發(fā)者的交流中,每次談到AI在產(chǎn)業(yè)中落地的話題時(shí),普遍會(huì)涉及兩個(gè)問(wèn)題:
一是對(duì)“黑盒”的恐懼。
傳統(tǒng)的AI開(kāi)發(fā)過(guò)程中,硬件底層對(duì)于上層應(yīng)用往往是一個(gè)“黑盒”,只能通過(guò)有限的接口進(jìn)行交互,就像一輛無(wú)法打開(kāi)引擎蓋的汽車,可以踩油門、打方向盤,但對(duì)引擎的內(nèi)部結(jié)構(gòu)一無(wú)所知。
切換到大模型訓(xùn)練的語(yǔ)境下,當(dāng)訓(xùn)練速度不理想,或者出現(xiàn)精度溢出等問(wèn)題時(shí),開(kāi)發(fā)者無(wú)法判斷問(wèn)題究竟出在算法層面,還是底層算子的調(diào)度上,只能被動(dòng)求助硬件廠商,失去了主動(dòng)權(quán)和效率。
二是對(duì)“捆綁”的抗拒。
一旦選擇某個(gè)計(jì)算平臺(tái),常常意味著和平臺(tái)的深度綁定,模型、算子、工具鏈、工程經(jīng)驗(yàn)等,都會(huì)被固化在計(jì)算生態(tài)中。
某種程度上也是英偉達(dá)“絕不會(huì)將CUDA開(kāi)源”的底氣:開(kāi)發(fā)者想要在GPU上實(shí)現(xiàn)高效的并行計(jì)算,必須要適應(yīng)CUDA生態(tài),想要轉(zhuǎn)向其他計(jì)算平臺(tái),代價(jià)則是昂貴的遷移成本,不可避免地需要重寫(xiě)代碼、重學(xué)新工具,直接勸退了很多萌生“脫離”想法的開(kāi)發(fā)者。
挑戰(zhàn)封閉的最佳方案,正是開(kāi)源開(kāi)放。封閉生態(tài)近乎無(wú)解的兩個(gè)“焦慮”,CANN卻拿出了合理的方案。
![]()
針對(duì)“黑盒”,CANN的開(kāi)源開(kāi)放不是簡(jiǎn)單的“秀代碼”,而是將算子庫(kù)、通信庫(kù)、編程語(yǔ)言、運(yùn)行時(shí)等全量開(kāi)源。
開(kāi)發(fā)者以前只能開(kāi)的跑車,現(xiàn)在有了全套的“發(fā)動(dòng)機(jī)圖紙”,可以深入到圖優(yōu)化、算子融合、內(nèi)存調(diào)度等底層機(jī)制進(jìn)行二次創(chuàng)新,模型移植、調(diào)試、性能分析的全過(guò)程“白盒化”。甚至不用局限于現(xiàn)成的工具和框架,可以根據(jù)自身需求進(jìn)行深度定制和優(yōu)化,實(shí)現(xiàn)更高的性能和效率。
針對(duì)“捆綁”,CANN的回答是架構(gòu)解耦、分層開(kāi)源開(kāi)放,所有組件支持獨(dú)立演進(jìn),實(shí)現(xiàn)分包獨(dú)立升級(jí)。
從底層的硬件驅(qū)動(dòng)、運(yùn)行時(shí)到中間的編譯器、編程語(yǔ)言,再到上層的各類計(jì)算、通信加速庫(kù),CANN的每一層都實(shí)現(xiàn)了物理上的松耦合。開(kāi)發(fā)者無(wú)須像過(guò)去那樣“牽一發(fā)而動(dòng)全身”,可以根據(jù)業(yè)務(wù)需求,按需引入或升級(jí)特定的組件功能,大幅降低系統(tǒng)集成和定制開(kāi)發(fā)的門檻,避免“被鎖死”的風(fēng)險(xiǎn)。
如果說(shuō)以前的CANN解決了“能用”的問(wèn)題,讓模型在自主算力上跑了起來(lái)。現(xiàn)在要解決的是“敢用”的問(wèn)題:通過(guò)全面開(kāi)源開(kāi)放,實(shí)現(xiàn)了從“黑盒”到“白盒”再到全過(guò)程“透明”,可解釋、可維護(hù)、可長(zhǎng)期演進(jìn),以最大的誠(chéng)意破解產(chǎn)業(yè)落地的信任天花板。
02 從“敢用”到“好用”,和千行萬(wàn)業(yè)開(kāi)發(fā)者共建生態(tài)
產(chǎn)業(yè)落地遠(yuǎn)不是計(jì)算平臺(tái)的終點(diǎn)。
一個(gè)繁榮的生態(tài),不僅僅要滿足“能用”“敢用”,還有另一個(gè)必須要回答的問(wèn)題——是不是“好用”。
不少開(kāi)發(fā)者對(duì)CUDA依賴甚至“上癮”,并非是因?yàn)椴豢商娲荂UDA體系的文檔完善、示例豐富和龐大的開(kāi)發(fā)者社區(qū),在使用過(guò)程中遇到了問(wèn)題,大概率能搜到答案。
CANN對(duì)“好用”有著更深的理解,試圖走出一條新路。
路徑一:提升開(kāi)發(fā)易用性,以社區(qū)為陣地,構(gòu)建全鏈路知識(shí)體系。
為了降低學(xué)習(xí)門檻,CANN投入了巨大資源打造開(kāi)源社區(qū),匯聚了開(kāi)源、學(xué)習(xí)、活動(dòng)等資源,給開(kāi)發(fā)者提供了一站式直達(dá)體驗(yàn)。
![]()
在學(xué)習(xí)資源上,目前已線63門在線課程、22門微認(rèn)證,涵蓋從Ascend C算子開(kāi)發(fā)入門到進(jìn)階的全流程。
在實(shí)戰(zhàn)演練上,通過(guò)CANN訓(xùn)練營(yíng)、昇騰AI算子挑戰(zhàn)賽等活動(dòng)以賽代練,比如CANN訓(xùn)練營(yíng)已經(jīng)開(kāi)展了12季。
在文檔支持上,開(kāi)源社區(qū)提供了從單任務(wù)到場(chǎng)景化的知識(shí)體系,包括100+專題課程和10+場(chǎng)景化文檔……
路徑二:“放權(quán)”給開(kāi)發(fā)者,人人都能參與,每個(gè)人都可以是貢獻(xiàn)者。
打一個(gè)比方:CANN構(gòu)建了一套顆粒度極細(xì)的“全棧積木系統(tǒng)”,讓開(kāi)發(fā)者不再是被動(dòng)的“使用者”,而是擁有不同構(gòu)建權(quán)限的“架構(gòu)師”。
模型開(kāi)發(fā)者可以直接調(diào)用封裝好的算子庫(kù)和通信庫(kù),省去打磨細(xì)節(jié)的時(shí)間,專注于上層建筑的宏偉設(shè)計(jì)。
算子開(kāi)發(fā)者可以根據(jù)特殊需求,自行設(shè)計(jì)并制造出形狀各異的高性能“異形磚”,解決通用件無(wú)法解決的難題。
深度發(fā)燒友可以對(duì)Runtime等底層資源管理能力進(jìn)行極致調(diào)優(yōu),夯實(shí)最底層的“地基”,徹底釋放硬件性能。
結(jié)果有何不同?
我們找到了兩個(gè)有代表性的開(kāi)發(fā)者故事。
第一個(gè)是哈爾濱工業(yè)大學(xué)的蘇統(tǒng)華教授,他的團(tuán)隊(duì)基于CANN的Ascend C打造了昇騰NPU原生Numpy——AsNumpy,在Python層完全兼容Numpy API,用戶無(wú)需額外學(xué)習(xí)成本,即可在昇騰NPU上實(shí)現(xiàn)高效的科學(xué)計(jì)算。
第二個(gè)是杭州天寬科技有限公司,依托CANN開(kāi)發(fā)的“智能巡檢場(chǎng)景算子庫(kù)”,讓巡檢效率提升了3倍、停電事故率下降了30%、應(yīng)急響應(yīng)與維修效率提升了20%,打破了傳統(tǒng)巡檢模式安全、效率與成本的“不可能三角”。
倘若是封閉的體系,開(kāi)發(fā)者大概率只能做調(diào)用接口的應(yīng)用創(chuàng)新,無(wú)法對(duì)算子進(jìn)行自定義擴(kuò)展。
但在CANN的生態(tài)里,創(chuàng)新不再完全依賴平臺(tái),開(kāi)發(fā)者能更充分地釋放硬件潛能,千行萬(wàn)業(yè)的開(kāi)發(fā)者都能成為生態(tài)的貢獻(xiàn)者。即使是人數(shù)不多的高校科研團(tuán)隊(duì)、初創(chuàng)公司,也能參與到底層的創(chuàng)新和優(yōu)化。
03 當(dāng)“透明”成為前提,計(jì)算產(chǎn)業(yè)的運(yùn)行規(guī)則正在改變
權(quán)力的重構(gòu)往往伴隨著規(guī)則的重塑。
CANN的全面開(kāi)源開(kāi)放,不只是“另一種實(shí)現(xiàn)路徑”,也在悄然改變計(jì)算產(chǎn)業(yè)默認(rèn)的運(yùn)行規(guī)則。
在新一輪的AI浪潮中,競(jìng)爭(zhēng)的焦點(diǎn)早已不是單純的算力或算法,而是圍繞軟件、開(kāi)發(fā)者與生態(tài)的博弈。CANN的全面開(kāi)源,掀起了一場(chǎng)透明度革命,將對(duì)技術(shù)、生態(tài)、產(chǎn)業(yè)方向等產(chǎn)生深遠(yuǎn)影響。
在技術(shù)層面,從“黑盒”到“白盒”,將徹底改變AI開(kāi)發(fā)模式。
站在開(kāi)發(fā)者的立場(chǎng)上,底層機(jī)制不透明,只能依賴官方文檔了解,在很大程度上被束縛了拳腳。
CANN的全面開(kāi)源開(kāi)放,讓編譯器、算子庫(kù)、運(yùn)行時(shí)等核心組件完全可見(jiàn),開(kāi)發(fā)者可以直接洞察硬件的運(yùn)行邏輯,進(jìn)行更深層次、更精準(zhǔn)的性能優(yōu)化,等于將創(chuàng)新的主動(dòng)權(quán)交還到了每一位開(kāi)發(fā)者手中。
相對(duì)應(yīng)的就是開(kāi)發(fā)門檻的降低。
以算子開(kāi)發(fā)為例,過(guò)去的門檻高到不敢用,CANN開(kāi)源了CATLASS算子模板庫(kù)后,只需簡(jiǎn)單的參數(shù)配置,即可快速生成適配不同形狀和精度的矩陣乘算子,大大提升了開(kāi)發(fā)效率和靈活性。
![]()
在生態(tài)層面,從“封閉獨(dú)奏”到“開(kāi)放共治”,構(gòu)建最大公約數(shù)。
一個(gè)計(jì)算生態(tài)的長(zhǎng)期生命力,源于開(kāi)放、透明和集體智慧。CANN的全面開(kāi)源開(kāi)放,正是遵循了這一邏輯。
譬如前面提到的天寬科技,除了AI智能巡檢方案,還開(kāi)源了具身智能巡檢行業(yè)標(biāo)準(zhǔn)算子庫(kù),完成了從“使用者”到“貢獻(xiàn)者”的轉(zhuǎn)變。對(duì)于電力、工業(yè)等有具身智能巡檢需求的開(kāi)發(fā)者來(lái)說(shuō),有了開(kāi)源的行業(yè)算子庫(kù),將進(jìn)一步降低了軟硬件適配的成本和難度。
當(dāng)越來(lái)越多企業(yè)把自身的工程實(shí)踐轉(zhuǎn)化為可被復(fù)用的公共能力,計(jì)算生態(tài)的演進(jìn)就不再依賴單點(diǎn)突破,而是通過(guò)不斷擴(kuò)大的最大公約數(shù),推動(dòng)整個(gè)產(chǎn)業(yè)走向成熟與繁榮。
在產(chǎn)業(yè)層面,從“平臺(tái)主導(dǎo)”到“多元協(xié)作”,釋放行業(yè)生產(chǎn)力。
創(chuàng)新的節(jié)奏不再被單個(gè)平臺(tái)主導(dǎo),產(chǎn)業(yè)分工或?qū)摹吧舷掠我栏疥P(guān)系”,自發(fā)形成一個(gè)“能力協(xié)作網(wǎng)絡(luò)”。
比如在能源、制造、交通等領(lǐng)域,瓶頸往往不在模型本身,而是算子效率、數(shù)據(jù)流轉(zhuǎn)、實(shí)時(shí)調(diào)度等工程細(xì)節(jié)。CANN的全面開(kāi)源開(kāi)放,讓行業(yè)可以圍繞自身場(chǎng)景,對(duì)關(guān)鍵路徑進(jìn)行定制優(yōu)化,不必等待平臺(tái)版本演進(jìn),讓算力更高效地轉(zhuǎn)化為生產(chǎn)力。
開(kāi)源開(kāi)放的終極目的,無(wú)外乎為產(chǎn)業(yè)提供探索和創(chuàng)新空間。就這一點(diǎn)而言,CANN正在和千行萬(wàn)業(yè)雙向奔赴。
畢竟一個(gè)計(jì)算生態(tài)的核心價(jià)值,不是限制開(kāi)發(fā)者,而是賦能開(kāi)發(fā)者,放大創(chuàng)新的杠桿效應(yīng);一個(gè)健康的計(jì)算生態(tài),取決于能否降低創(chuàng)新的邊際成本,能否讓創(chuàng)新轉(zhuǎn)化為產(chǎn)業(yè)生產(chǎn)力。
04 寫(xiě)在最后
一個(gè)計(jì)算體系被用于長(zhǎng)期、關(guān)鍵、不可中斷的生產(chǎn)場(chǎng)景時(shí),不透明本身,就是最大的風(fēng)險(xiǎn)。
CANN的全面開(kāi)源開(kāi)放,本質(zhì)上在做一件事,即消除“黑盒”,讓底層機(jī)制可審視、可驗(yàn)證、可優(yōu)化,把原本隱性的、不確定的風(fēng)險(xiǎn),轉(zhuǎn)化為工程上可定位、可控制、可協(xié)同解決的問(wèn)題。
也讓我們有理由相信,封閉終將讓渡于開(kāi)放,只有打破封閉的藩籬,形成創(chuàng)新合力,才能構(gòu)建起堅(jiān)固的數(shù)智化根基。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.