9月12日,2025全球數(shù)據(jù)存儲教授論壇在深圳舉行,華為公司揭曉第五屆“奧林帕斯獎”唯一最高獎:清華大學(xué)計算機系武永衛(wèi)教授團隊以“以存換算”技術(shù)方案摘下桂冠,這是清華繼2020年舒繼武團隊后第二次在這一全球賽事中登頂。兩次獲獎,相隔五年,卻共同指向同一命題——讓數(shù)據(jù)存得更快、更省、更智能,也為AI大模型時代的中國存儲方案寫下有力注腳。
![]()
武永衛(wèi)團隊此次瞄準(zhǔn)的是大模型推理的“內(nèi)存焦慮”。隨著參數(shù)規(guī)模膨脹,推理階段近九成顯存被KVCache占用,GPU外的大量CPU內(nèi)存、NVMe SSD與近存計算資源卻長期閑置。團隊提出“以存換算”新范式:先把KVCache做成全局共享池,讓同一段緩存跨卡、跨機、跨任務(wù)復(fù)用,命中率提高3.6倍;再把“冷數(shù)據(jù)”下沉到SSD或近存計算節(jié)點,“熱計算”繼續(xù)留在顯存,實現(xiàn)存算異構(gòu)協(xié)同,顯存需求平均下降58%。基于這一思路,他們發(fā)起Mooncake架構(gòu)與KTransformers框架兩個開源項目,已在GitHub收獲1.8萬星,被月之暗面Kimi、阿里、螞蟻、訊飛等平臺采用,單卡即可跑128k長文本,相當(dāng)于把原本需要8卡A100的推理任務(wù)壓縮到3卡完成,硬件成本直降六成。相關(guān)論文獲FAST 2025最佳論文獎,36項發(fā)明專利已獲授權(quán),NVIDIA最新發(fā)布的Dynamo系統(tǒng)也直接借鑒了Mooncake的核心組件。
時間撥回2020年,首屆奧林帕斯獎同樣被清華摘下。舒繼武教授團隊面對的是內(nèi)存數(shù)據(jù)“掉電即失”的頑疾,他們提出持久性內(nèi)存存儲系統(tǒng)構(gòu)建方案,通過重新設(shè)計文件系統(tǒng)、索引結(jié)構(gòu)與一致性協(xié)議,讓新型非易失內(nèi)存既能像內(nèi)存一樣字節(jié)尋址,又能像磁盤一樣斷電不丟。系統(tǒng)上線后,數(shù)據(jù)庫事務(wù)處理性能提升六倍,故障恢復(fù)時間從分鐘級縮短到秒級,一舉奪得百萬獎金。五年過去,該成果已規(guī)模化應(yīng)用于多家云廠商的持久內(nèi)存實例,成為業(yè)界構(gòu)建高可靠、低延遲存儲的參考模板。
![]()
華為公司董事、ICT產(chǎn)品與解決方案總裁楊友桂在頒獎現(xiàn)場表示,奧林帕斯獎五年累計投入1.5億元,共吸引全球五百余位教授、兩千余名學(xué)者投身存儲基礎(chǔ)研究。他透露,2025年華為將基于Mooncake架構(gòu)發(fā)布新一代AI存儲節(jié)點,預(yù)計2026年規(guī)模商用。中國計算機學(xué)會存儲專委會主任馮丹教授則認(rèn)為,從“磁盤—內(nèi)存—緩存”到“持久內(nèi)存—近存計算”,存儲層級不斷擴張,清華團隊把“存儲”抽象為可彈性供給的“算力外圍”,完成了存儲與算力的第二次分離,為萬卡級大模型集群提供了新的擴展范式。
至此,清華大學(xué)在華為“奧林帕斯獎”賽事中已斬獲兩項最高獎、一項先鋒獎,繼續(xù)領(lǐng)跑全球高校。隨著AI進入大模型縱深階段,存儲與計算的協(xié)同創(chuàng)新仍將持續(xù)刷新產(chǎn)業(yè)想象,而清華人兩次把旗幟插上奧林帕斯山頂,也讓“中國方案”成為定義下一代數(shù)據(jù)底座的重要聲音。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.