【全球存儲(chǔ)觀察 | 科技熱點(diǎn)關(guān)注】
![]()
近年來,在國家“東數(shù)西算”的宏大棋盤上,內(nèi)蒙古正憑借其獨(dú)特的區(qū)位、能源、氣候與政策優(yōu)勢(shì),崛起為“東數(shù)西算”的重要樞紐節(jié)點(diǎn),正在全力打造全國的綠色算力保障基地和供給基地。
在這里,中國移動(dòng)建成了全球運(yùn)營商最大單體液冷智算中心,成千上萬的GPU算力日夜不息,為遠(yuǎn)在京津冀的AI大模型應(yīng)用與創(chuàng)新,源源不斷提供著澎湃動(dòng)能。
于此,中國移動(dòng)呼和浩特?cái)?shù)據(jù)中心總經(jīng)理王科峰表示,中國移動(dòng)正在積極踐行“建設(shè)服務(wù)數(shù)智內(nèi)蒙古,服務(wù)全國一盤棋”的使命,聚焦綠色、安全、高效、協(xié)同的數(shù)據(jù)中心建設(shè)任務(wù),持續(xù)構(gòu)建面向未來的AI算力基礎(chǔ)設(shè)施,實(shí)施中國移動(dòng)從過去傳統(tǒng)運(yùn)營商“+AI”范式向現(xiàn)在“AI+”新范式的戰(zhàn)略轉(zhuǎn)變。
![]()
同時(shí),王科峰也指出:就算再快的算力,若沒有與之匹配的存儲(chǔ)系統(tǒng),也難以發(fā)揮其全部效力。
一場關(guān)于存儲(chǔ)角色的轉(zhuǎn)型,正在算力基礎(chǔ)設(shè)施的核心地帶悄然發(fā)生。
算力范式加速變革,
存儲(chǔ)遭遇“四大壓力”挑戰(zhàn)
AI大模型的爆發(fā),徹底重塑了算力基礎(chǔ)設(shè)施。通過與眾多行業(yè)企業(yè)的長期交流與合作,曙光存儲(chǔ)運(yùn)營總監(jiān)石靜對(duì)此有著深刻的認(rèn)識(shí),她認(rèn)為計(jì)算架構(gòu)已從CPU為主,轉(zhuǎn)向以GPU和AI加速卡為核心的的智算時(shí)代,存儲(chǔ)系統(tǒng)需要應(yīng)對(duì)的挑戰(zhàn)發(fā)生了根本性改變,四大壓力不可忽視。
![]()
其一,規(guī)模之壓,極限挑戰(zhàn)。面對(duì)計(jì)算規(guī)模劇增的全新變化,千卡、萬卡集群意味著成千上萬個(gè)計(jì)算節(jié)點(diǎn)同時(shí)發(fā)起數(shù)據(jù)請(qǐng)求,對(duì)存儲(chǔ)的并發(fā)訪問能力提出前所未有的極限挑戰(zhàn)。
其二,數(shù)據(jù)之變,極高調(diào)度。面對(duì)數(shù)據(jù)海量與價(jià)值重生的新變化,AI訓(xùn)練數(shù)據(jù)集規(guī)模動(dòng)輒數(shù)百TB乃至PB級(jí),且大模型讓曾經(jīng)的“冷數(shù)據(jù)”開啟價(jià)值重生,變?yōu)椤皽財(cái)?shù)據(jù)”甚至“熱數(shù)據(jù)”。數(shù)據(jù)需在訓(xùn)練、推理、歸檔間智能流動(dòng),對(duì)跨協(xié)議、跨介質(zhì)、跨設(shè)備的數(shù)據(jù)調(diào)度能力要求極高。
其三,性能之躍,極致體驗(yàn)。面對(duì)性能要求出現(xiàn)指數(shù)級(jí)躍升的新變化,AI大模型時(shí)代的存儲(chǔ)性能,比傳統(tǒng)高性能計(jì)算有數(shù)倍提升。如在訓(xùn)練階段,需超高帶寬喂飽GPU,避免高價(jià)GPU“空轉(zhuǎn)”等待數(shù)據(jù)。而在推理階段,則需千萬級(jí)IOPS與毫秒級(jí)極低延時(shí),以滿足高并發(fā)用戶場景實(shí)際需求,從而保障用戶體驗(yàn)。
其四,TCO之效,極省成本。面對(duì)TCO與效率平衡的新變化,需通過高密度、節(jié)能技術(shù),在提供全閃高性能與混閃高性價(jià)比存儲(chǔ)資源的同時(shí),有效控制總體建設(shè)與運(yùn)營成本。
面對(duì)這四大壓力挑戰(zhàn),存儲(chǔ)系統(tǒng)若不能進(jìn)化,就將成為制約AI算力整體性能的短板。“任何高端芯片,沒有高效的存儲(chǔ)系統(tǒng)來支撐,再快的算力可能也發(fā)揮不出來效力。” 中國移動(dòng)呼和浩特?cái)?shù)據(jù)中心總經(jīng)理王科峰如是說道,強(qiáng)大算力的背后,離不開先進(jìn)存力作為AI基礎(chǔ)設(shè)施的底座,并實(shí)現(xiàn)協(xié)同加持。
國家關(guān)鍵樞紐的最佳實(shí)踐,
綠色智算再發(fā)現(xiàn)與存儲(chǔ)價(jià)值重塑
毋庸置疑,當(dāng)前的中國算力基礎(chǔ)設(shè)施規(guī)模還在持續(xù)擴(kuò)大。截至2025年6月,在用算力中心智算規(guī)模達(dá)788EFlops,算力中心平均PUE降至1.42。但算力發(fā)展仍面臨能耗與效率的權(quán)衡問題。
2025年10月23日,中國移動(dòng)攜手曙光存儲(chǔ)舉辦“隨數(shù)而動(dòng),智存智用”活動(dòng),在“東數(shù)西算”北方樞紐的中國移動(dòng)呼和浩特?cái)?shù)據(jù)中心,通過實(shí)地探訪,我看到了應(yīng)對(duì)這一系列挑戰(zhàn)的國家級(jí)方案。
![]()
這里規(guī)劃著11萬架機(jī)柜,目前已建成近3萬架,承載著近2萬P的算力,智能算力15600P,其中90%以上服務(wù)京津冀地區(qū)。更令人矚目的是其綠色指標(biāo):2025年園區(qū)PUE整體降至1.22,智算中心PUE更是低至1.15。據(jù)中國移動(dòng)技術(shù)專家趙一帆透露,通過“綠色能源+高效制冷+智能調(diào)度”三重路徑,實(shí)現(xiàn)算力增長與碳排脫鉤。2025年100%綠電目標(biāo)達(dá)成后,呼和浩特?cái)?shù)據(jù)中心將成為全國首個(gè)全綠電智算樞紐,為“東數(shù)西算”提供低碳范本。
作為東數(shù)西算戰(zhàn)略的關(guān)鍵樞紐,中國移動(dòng)呼和浩特?cái)?shù)據(jù)中心不僅是中國移動(dòng)“4+N+31+X”算力網(wǎng)絡(luò)中規(guī)模最大、技術(shù)最先進(jìn)、保障最完備的中心節(jié)點(diǎn),也是推動(dòng)綠色低碳與智能計(jì)算融合發(fā)展的標(biāo)志性工程。
但值得一提的是,規(guī)模的宏大與綠色的領(lǐng)先,并非故事的全部。
“我們?nèi)ツ杲ǔ闪巳蜻\(yùn)營商單體最大的智算中心,國產(chǎn)化芯片占比達(dá)89%。”據(jù)王科峰介紹,在中國移動(dòng)九天大模型和中石油昆侖大模型等訓(xùn)練支撐中,讓大家深刻認(rèn)識(shí)到,高效的存儲(chǔ)系統(tǒng)才是釋放算力潛力的關(guān)鍵。
這一認(rèn)知來自最佳實(shí)踐的真知。“現(xiàn)在計(jì)算和訓(xùn)練已不是決定最終效果的唯一天花板。”王科峰認(rèn)為,有必要在存儲(chǔ)和計(jì)算的協(xié)同上進(jìn)行深耕研究。
而今,中國已邁入AI驅(qū)動(dòng)的智算時(shí)代,數(shù)據(jù)存儲(chǔ)系統(tǒng)的重要性愈發(fā)凸顯。AI時(shí)代存儲(chǔ)認(rèn)知:抓住變化,才能抓住發(fā)展的關(guān)鍵。從傳統(tǒng)存儲(chǔ)到藍(lán)光歸檔,再到如今的高性能先進(jìn)存力,中國移動(dòng)在數(shù)據(jù)存儲(chǔ)與管理的演進(jìn)中,完成了對(duì)存儲(chǔ)價(jià)值的戰(zhàn)略再定位。
從中,我們也不難發(fā)現(xiàn),通過存算協(xié)同,進(jìn)一步實(shí)現(xiàn)存儲(chǔ)價(jià)值重塑,這與智算中心綠色低碳發(fā)展趨勢(shì)也不謀而合。誠然,在中國移動(dòng)呼和浩特智算中心的實(shí)踐中,曙光存儲(chǔ)技術(shù)不僅解決了“四大壓力”問題,更與中心的綠色發(fā)展理念深度契合。
借助曙光智能分層、加密去重等技術(shù),存儲(chǔ)系統(tǒng)自身能耗顯著降低,與中國移動(dòng)PUE綠色目標(biāo)同頻共振。這種軟硬結(jié)合的優(yōu)化,共同打造了規(guī)模與綠色智算協(xié)同發(fā)展的創(chuàng)新范式。
更重要的是,這套中國移動(dòng)呼和浩特智算中心采用的存算協(xié)同方案,已轉(zhuǎn)化為實(shí)實(shí)在在的生產(chǎn)力,并成功支撐中國移動(dòng)九天大模型、中石油昆侖大模型的訓(xùn)練,還賦能了在政務(wù)、醫(yī)療、礦山等多個(gè)領(lǐng)域的150多項(xiàng)AI應(yīng)用和40多項(xiàng)行業(yè)大模型落地。
與此同時(shí),在存儲(chǔ)生態(tài)建設(shè)方面,中國移動(dòng)呼和浩特智算中心與伙伴共同推動(dòng)技術(shù)創(chuàng)新,打造了多個(gè)行業(yè)標(biāo)桿案例,為產(chǎn)業(yè)發(fā)展提供了可借鑒的經(jīng)驗(yàn)。
數(shù)據(jù)存儲(chǔ)的進(jìn)化與躍升,
從附庸到并跑的技術(shù)破局
從中國移動(dòng)呼和浩特?cái)?shù)據(jù)中心戰(zhàn)略定位,看AI存儲(chǔ)的時(shí)代價(jià)值,曙光存儲(chǔ)運(yùn)營總監(jiān)石靜分析認(rèn)為,AI時(shí)代的存儲(chǔ)明顯面臨重大角色轉(zhuǎn)型。
面對(duì)智算中心的迫切需求,作為中國先進(jìn)存力的引領(lǐng)者之一,曙光給出了答案:存儲(chǔ)不應(yīng)再是計(jì)算的附庸者或陪同者,而必須成為并跑者。
這一地位的轉(zhuǎn)變,依托于曙光20多年自主存儲(chǔ)技術(shù)研發(fā)與行業(yè)實(shí)踐積淀的硬實(shí)力。從2009年國內(nèi)首個(gè)單一容量16PB存儲(chǔ)系統(tǒng),到2019年首個(gè)單一系統(tǒng)超100PB存儲(chǔ)系統(tǒng),再到如今落地十幾個(gè)百PB級(jí)項(xiàng)目,服務(wù)多個(gè)國家級(jí)計(jì)算中心、智算中心、分布式計(jì)算節(jié)點(diǎn),曙光存儲(chǔ)技術(shù)歷經(jīng)了國家級(jí)工程的嚴(yán)苛檢驗(yàn)。
在中國移動(dòng)呼和浩特智算中心,曙光部署了總量逾60PB的存儲(chǔ)資源,包括全閃、混閃產(chǎn)品。而其核心,就是“3+5高效協(xié)同” 的技術(shù)體系,即在數(shù)據(jù)I/O路徑的三個(gè)層級(jí)上,融入五項(xiàng)加速技術(shù),通過加速技術(shù)把本地不同層級(jí)的物理資源充分利用起來,把網(wǎng)絡(luò)優(yōu)化到極致,實(shí)現(xiàn)存儲(chǔ)與計(jì)算的深度協(xié)同。
一方面,創(chuàng)新超級(jí)隧道技術(shù),攻克時(shí)延瓶頸。
在存儲(chǔ)節(jié)點(diǎn)內(nèi)部,曙光通過“超級(jí)隧道”技術(shù),對(duì)CPU、內(nèi)存、網(wǎng)卡和SSD進(jìn)行硬件資源虛擬化與池化。將一個(gè)物理存儲(chǔ)節(jié)點(diǎn)劃分為數(shù)十甚至上百個(gè)獨(dú)立的虛擬系統(tǒng),為每個(gè)數(shù)據(jù)I/O提供獨(dú)享的專用通道。這種資源隔離機(jī)制從根本上消除了干擾,將I/O時(shí)延降至最低,實(shí)現(xiàn)存儲(chǔ)系統(tǒng)的極致高性能。
二方面,聚焦近計(jì)算親應(yīng)用,讓數(shù)據(jù)主動(dòng)靠近GPU。
為解決數(shù)據(jù)搬運(yùn)瓶頸,曙光構(gòu)建了多層次緩存池如內(nèi)存池、本地SSD池,推行“近計(jì)算”理念。通過智能調(diào)度數(shù)據(jù)流向,使數(shù)據(jù)能在內(nèi)存處理就不下放到SSD,能在本地計(jì)算就不跨網(wǎng)絡(luò)訪問遠(yuǎn)端存儲(chǔ)。這樣就可以將數(shù)據(jù)盡可能地保留在離GPU計(jì)算單元最近的地方,據(jù)測算可有效將I/O性能提升10-20倍,極大緩解了訓(xùn)練和推理過程中GPU的“數(shù)據(jù)饑餓”問題。
三方面,強(qiáng)化智能運(yùn)營與高可靠,保障大規(guī)模集群穩(wěn)健運(yùn)行。
現(xiàn)實(shí)中,運(yùn)營中大型的算力中心,計(jì)費(fèi)是首要的事情,得保證每個(gè)付費(fèi)了的用戶能享受到對(duì)應(yīng)的服務(wù)等級(jí),因此在這里首先得提一下智能QoS。在多租戶的算力中心,曙光存儲(chǔ)通過文件系統(tǒng)與客戶端的精細(xì)QoS控制,確保為不同客戶提供的性能嚴(yán)格隔離、互不干擾,實(shí)現(xiàn)了服務(wù)等級(jí)協(xié)議的可量化、可售賣,為運(yùn)營方創(chuàng)造增值。
與此同時(shí),在面對(duì)數(shù)百、數(shù)千節(jié)點(diǎn)的大規(guī)模集群時(shí),曙光存儲(chǔ)依托數(shù)十個(gè)百PB級(jí)項(xiàng)目的落地經(jīng)驗(yàn),通過分而治之的策略,在集群快速拓?fù)洹⒕W(wǎng)絡(luò)通信穩(wěn)定交付和分布式高并發(fā)處理上進(jìn)行優(yōu)化,將故障影響局部化,保障系統(tǒng)整體平穩(wěn)。
不過,知己知彼,百戰(zhàn)不殆。通過智能分析工具預(yù)先洞察業(yè)務(wù)I/O模型,主動(dòng)為計(jì)算平臺(tái)提供調(diào)優(yōu)建議,引導(dǎo)其以最佳方式與存儲(chǔ)交互。從而,能夠?yàn)檎w的AI訓(xùn)練和業(yè)務(wù)調(diào)優(yōu)做相關(guān)的指導(dǎo)。只有充分知道業(yè)務(wù)需要什么,存儲(chǔ)才能從并跑者變成計(jì)算的知己,共同將業(yè)務(wù)性能發(fā)揮到極致,從而真正實(shí)現(xiàn)存算深度協(xié)同。
小結(jié):
算力與存力協(xié)同發(fā)展,
共拓智算時(shí)代的未來藍(lán)海
從內(nèi)蒙古呼和浩特到全國,從“東數(shù)西算”到千行百業(yè),AI的浪潮撲面而來,正以前所未有的力量重塑著一切。
AI大時(shí)代的發(fā)展勢(shì)不可擋,中國移動(dòng)與曙光存儲(chǔ)在呼和浩特智算中心的實(shí)踐揭示了一個(gè)樸素而深刻的道理:真正的智能算力,從來都不只是芯片的峰值性能,而是計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)深度融合的系統(tǒng)能力,以及高效的服務(wù)能力輸出。
當(dāng)存儲(chǔ)完成了從幕后到臺(tái)前、從附庸到并跑的歷史性躍升,算力與存力協(xié)同發(fā)展的理念正式成為了打造全球運(yùn)營商最大單體液冷智算中心的關(guān)鍵,于是,我們就更有了足夠的底氣,讓先進(jìn)存力成為釋放算力潛能的關(guān)鍵引擎,攜手共拓智算時(shí)代的未來藍(lán)海。
你怎么看?
歡迎文末評(píng)論補(bǔ)充!
【全球存儲(chǔ)觀察|全球云觀察|科技明說|阿明觀察】專注科技公司分析,用數(shù)據(jù)說話,帶你看懂科技。本文和作者回復(fù)僅代表個(gè)人觀點(diǎn),不構(gòu)成任何投資建議。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.