![]()
9月初的2025世界智能產(chǎn)業(yè)博覽會期間,中科曙光協(xié)同AI芯片、AI整機、大模型等20多家產(chǎn)業(yè)鏈上下游企業(yè),共同發(fā)布了國內(nèi)首個AI計算開放架構(gòu),被外界解讀為國產(chǎn)智算的“安卓模式”。
一個禮拜前的世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會期間,中科曙光發(fā)布了采用AI計算開放架構(gòu)的全球首個單機柜級640卡超節(jié)點scaleX640,標志著國產(chǎn)智算生態(tài)從架構(gòu)層開放走向了工程級落地。
相比封閉生態(tài),開放的產(chǎn)業(yè)生態(tài)系統(tǒng)更加復(fù)雜,需要更多的開發(fā)者參與其中,而人才一直是整個產(chǎn)業(yè)的短板。能否培養(yǎng)出產(chǎn)業(yè)需要的人才生力軍,直接關(guān)系到國產(chǎn)AI生態(tài)的發(fā)展進程。
草蛇灰線,伏脈千里。
時間回到2020年,中科曙光聯(lián)合國家先進計算產(chǎn)業(yè)創(chuàng)新中心和一眾知名高校、企業(yè)、學(xué)術(shù)機構(gòu)共同籌辦了第一屆先導(dǎo)杯。和常規(guī)賽事最大的不同,“以實踐為導(dǎo)向”始終是先導(dǎo)杯的鮮明標簽,緊跟前沿創(chuàng)新和產(chǎn)業(yè)痛點,在高校和產(chǎn)業(yè)間搭建了一座橋梁。
![]()
剛剛結(jié)束的第六屆先導(dǎo)杯上,來自三個參與者的故事,終于讓外界讀懂了中科曙光多年的堅持:并非是一個割裂的賽事,正在用“教學(xué)訓(xùn)賽”的綜合培養(yǎng)模式,為中國AI產(chǎn)業(yè)培養(yǎng)后備力量。
01 “我們要解決人才的斷層”
山東科技大學(xué)的王威,目前在計算機科學(xué)與工程學(xué)院參與相關(guān)領(lǐng)域的研究工作。在此之前,他擁有國家超算中心多年的工作經(jīng)歷。
橫跨產(chǎn)業(yè)界和學(xué)術(shù)界的“兩棲”經(jīng)歷,讓他對中國AI和高性能計算領(lǐng)域的人才現(xiàn)狀,有一種旁人難及的清醒認知。“最大的難點之一,就是人才培養(yǎng)和產(chǎn)業(yè)需求之間,存在一個斷層。”
王威在采訪中多次提及“人才斷層”,人工智能和高性能計算日新月異,而多數(shù)高校的教學(xué)內(nèi)容還停留在課本上面,與產(chǎn)業(yè)界的真實場景嚴重脫節(jié)。結(jié)果就是,產(chǎn)業(yè)界迫切需要能“直接能夠在國產(chǎn)平臺上深度參與項目”的人才,高校畢業(yè)生卻需要“一個很長的學(xué)習(xí)周期”才能真正上手。
![]()
作為第六屆“先導(dǎo)杯”O(jiān)NNX Runtime算子優(yōu)化賽題的出題人,王威瞄準了“脫節(jié)的斷層”。
在賽題設(shè)計上,王威坦言:不是一道“練習(xí)題”,而是產(chǎn)業(yè)界公認的一個“硬骨頭”。要求參賽學(xué)生基于海光DCU和ONNX Runtime推理框架,在確保輸出精度滿足誤差標準的前提下,針對Attention、BatchNormalization、Conv、LeakyReLU、GroupNormalization核心算子進行性能優(yōu)化。
背后有著雙重考量。
第一是考驗學(xué)生們的“復(fù)合能力”。絕不是簡單的編程任務(wù),直接把負載均衡、顯存壓力、通信瓶頸等技術(shù)壁壘拋給了學(xué)生。
參賽學(xué)生不能再像過去那樣只停留在書本概念上,必須打通一條完整的技術(shù)鏈路:首先要把“計算機體系結(jié)構(gòu)中所學(xué)的核心知識”真正用上;其次要具備在國產(chǎn)軟硬件生態(tài)上調(diào)試的“工程能力”;最后還要在高強度的試錯和優(yōu)化中,磨煉出解決復(fù)雜問題的系統(tǒng)思維。
第二是關(guān)乎未來的“職業(yè)啟蒙”。在“自主可控”的戰(zhàn)略下,發(fā)展國產(chǎn)AI生態(tài)已是必然,但生態(tài)的繁榮,歸根結(jié)底靠的是“人”。
作為高性能計算領(lǐng)域的研究者,王威深知底層優(yōu)化工作的“枯燥”,“可能三年才能入門,五年才剛剛有感覺。”把真實的產(chǎn)業(yè)難題交給學(xué)生,希望他們從過去“站在教科書外看概念”,變成“直接調(diào)試產(chǎn)業(yè)難題的人”,認識到國產(chǎn)AI生態(tài)的瓶頸和機會,進而“主動去探索”“深入去學(xué)習(xí)”。
讓王威印象深刻的是,“有時候凌晨一兩點,學(xué)生們還在問問題”,“去年參加先導(dǎo)杯的本科生,比賽結(jié)束后毅然選擇攻讀高性能計算方向的研究生”,“不少學(xué)生參加比賽后,找到了努力的方向”……
在國內(nèi)的高校中,像王威這樣的“布道者”還有很多,他們用源自內(nèi)心深處的熱愛,在學(xué)生們心中埋下了投身國產(chǎn)AI生態(tài)的種子。當(dāng)越來越多的種子生根、發(fā)芽、開花、結(jié)果,曾經(jīng)制約產(chǎn)業(yè)繁榮的人才斷層,將被一批批具備工程實操力、系統(tǒng)思維的新生力量“填平”。
02 “打了場從零開始的硬仗”
山西大學(xué)的大二學(xué)生王嘉宇,是王威老師特別提到的一位選手。在第六屆“先導(dǎo)杯”的決賽入圍名單中,對比諸多名校的碩士乃至博士團隊,剛讀大二的王嘉宇無疑是個特例。
因為底層系統(tǒng)人才缺口較大,且存在人才培養(yǎng)標準不一、教育資源分布不均等問題,先導(dǎo)杯在2024年首次面向本科生開放報名,并創(chuàng)新引入了區(qū)域賽模式,面向西北、東北等地區(qū)開賽。
![]()
來自中西部高校的王嘉宇團隊,沒有被“相對有限的技術(shù)資源”束縛,用實打?qū)嵉某煽冏C明了先導(dǎo)杯推動教育公平、賦能多元人才的價值。
大多數(shù)同學(xué)跟著學(xué)校課程按部就班時,王嘉宇就主動報名參加了學(xué)校的“超算隊”。雖然日常訓(xùn)練使用的是學(xué)校所能提供的早期算力資源(例如英偉達V100),正是這份來之不易的機會,為王嘉宇打開了邁向超算世界的第一扇門,鍛造了在比賽中面對全新平臺時的適應(yīng)力和沖刺力。
王威老師設(shè)計的ONNX Runtime算子優(yōu)化賽題,對王嘉宇團隊來說,不亞于是一場從零開始的“硬仗”。
“盡管中科曙光提供的文檔和接口兼容性很高,遷移過程并沒有想象中艱難,在比賽開始時還是走了一些彎路。由于硬件差異,需要針對海光DCU做更精細的調(diào)整,結(jié)合算子原理和硬件參數(shù)綜合優(yōu)化,導(dǎo)致早期的性能表現(xiàn)不太理想。”
初期的不順利,并沒有嚇退王嘉宇團隊。
他們花了很長時間學(xué)習(xí)中科曙光提供的培訓(xùn)課程,在線上積極和其他同學(xué)溝通,在技術(shù)社區(qū)內(nèi)找資料,遇到不懂的問題就向出題老師請教,乃至整個國慶假期都在實驗室“刷性能”。最終找到了算子性能優(yōu)化的正確路徑:“我們發(fā)現(xiàn)性能瓶頸更多來自訪存而非計算,重新定義了warp大小,并嘗試使用warp shuffle優(yōu)化attention中的歸約性能……”
整個采訪過程中,王嘉宇每每提到第一次把attention、卷積跑通的細節(jié),言辭中都難掩心中的興奮勁兒。在他看來,比賽的意義不在名次,在于一次次“啃硬骨頭”的過程,一點點去推敲每個性能指標背后的邏輯,看到性能指標不斷被刷新,有一種“升級打怪”的快感。
也讓我們見證了這支年輕團隊強大的自驅(qū)力:沒有因“平臺不熟悉”止步,而是將挑戰(zhàn)視為學(xué)習(xí)的機會,并在比賽過程中形成了問題建模、性能分析、參數(shù)迭代、算子驗證的工程能力。
王嘉宇團隊的故事不會是個例,折射出的是國產(chǎn)AI生態(tài)加速成熟的縮影:當(dāng)先導(dǎo)杯為中西部高校學(xué)生搭建起通向前沿技術(shù)的舞臺,他們能夠近距離接觸國產(chǎn)智算平臺和產(chǎn)業(yè)真實問題,在真實的工程環(huán)境中驗證理論、打磨能力,會有更多潛藏的年輕力量被看見。
03 “國產(chǎn)生態(tài)需要我們參與”
如果說王嘉宇是憑借興趣和自驅(qū)力扎進來的“初生牛犢”,國防科技大學(xué)的研二學(xué)生朱天賜,則是一個“身在局中”的“準工程師”。國防科大的熏陶、“天河超算”的驕傲,在他心中種下了“使命導(dǎo)向”的擔(dān)當(dāng)。
早在本科階段,朱天賜就做過一款手語識別應(yīng)用,在比賽中拿到了不錯的名次,限于算力和數(shù)據(jù)集的瓶頸,最終沒有實現(xiàn)推廣應(yīng)用。那段經(jīng)歷讓他意識到:沒有智能算力的土壤,應(yīng)用將無法真正扎根。
不同于王嘉宇從零開始的啟蒙,朱天賜作為隊長參加了GMRES和ONNX兩道賽題的角逐,想要深入了解國產(chǎn)AI生態(tài)的真實痛點。
![]()
“之前在學(xué)校課程學(xué)的是碎片化的知識,知道什么是體系結(jié)構(gòu)、并行計算、內(nèi)存帶寬等概念,就像是零件盒里的螺絲、齒輪、彈簧,并沒有組裝成能夠運行的機械。通過先導(dǎo)杯的比賽,第一次把碎片化的知識,變成了解決實際問題的系統(tǒng)化能力。”
朱天賜遇到的第一個難題是優(yōu)化“矩陣向量乘”算子,一個看似基礎(chǔ)但極度考驗體系結(jié)構(gòu)理解的任務(wù)。
由于“矩陣向量乘”算子的性能瓶頸在于訪存,海光DCU的Wavefront是64線程,和英偉達的32線程不同,意味著以前的優(yōu)化習(xí)慣、經(jīng)驗參數(shù)不再適用,需要重新思考數(shù)據(jù)如何分塊、訪存如何對齊、調(diào)度如何設(shè)計。
為了解決這些問題,朱天賜和隊友們一遍遍跑實驗、畫訪存路徑、調(diào)tile size、做規(guī)約策略對比。有時候性能曲線不達標,就從硬件特性倒推數(shù)學(xué)計算、從數(shù)學(xué)表達式反推訪存行為、從訪存行為再反推并行策略……“純理論不會直接帶來性能提升,真正能提升性能的,是把理論轉(zhuǎn)換成工程路徑的能力”。
“硬核”的比賽過程,讓朱天賜對國產(chǎn)AI生態(tài)有了更深刻的認知:國產(chǎn)算力平臺的性能成熟度超出了預(yù)期,而且上手門檻比較低,但體系還不夠完善,仍需更多開發(fā)者參與和打磨。
親自上陣填補“缺口”經(jīng)歷,悄然影響了朱天賜的“自我定位”:以前,他更多站在知識體系的外環(huán),作為旁觀者學(xué)習(xí)別人怎么做;現(xiàn)在,意識到自己正處在國產(chǎn)AI生態(tài)的前線,是需要主動“補位”的那群人。
談到畢業(yè)后的職業(yè)規(guī)劃時,朱天賜堅定表示:將從事算子優(yōu)化、編譯優(yōu)化等方面的工作,為國產(chǎn)AI生態(tài)的繁榮添一塊磚。
04 寫在最后
過去十年,中國的AI生態(tài)解決了“有沒有”的問題。未來十年,問題將變成——“誰來用、誰會用”。算力、架構(gòu)、模型都可以通過技術(shù)迭代逐步補齊,唯有人才,是決定生態(tài)上限的“不可替代變量”。
先導(dǎo)杯的價值,在于把產(chǎn)業(yè)最真實的需求、最難啃的技術(shù)點、最具挑戰(zhàn)性的任務(wù),提前放到了年輕人面前,讓他們在最初的職業(yè)啟蒙階段就認識到:國產(chǎn)AI生態(tài)不是某一家廠商、某一所高校的戰(zhàn)役,而是一場面向未來的長期工程,需要更多“敢打硬仗”的建設(shè)者加入。
有理由相信,最終改變國產(chǎn)AI生態(tài)曲線的,不是某一代架構(gòu)、某一次發(fā)布會,而是被點燃的年輕力量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.