在AI數(shù)據(jù)中心時(shí)代,電力與算力基礎(chǔ)設(shè)施的設(shè)計(jì)、管理和部署正變得密不可分。電力、算力和冷卻組件日益被整合為統(tǒng)一系統(tǒng),進(jìn)行統(tǒng)籌規(guī)劃與優(yōu)化。然而,由于AI工作負(fù)載對(duì)高密度計(jì)算機(jī)架的需求,電力組件必須進(jìn)行“解耦”處理,既為高密集堆疊的服務(wù)器騰出空間,又要以遠(yuǎn)超以往的效率輸送更多電力。僅從額定功耗來(lái)看,一個(gè)兆瓦級(jí)的GPU機(jī)架產(chǎn)生的熱量約是滿載CPU機(jī)架的50倍。
“側(cè)掛車”模式應(yīng)運(yùn)而生
由開(kāi)放計(jì)算項(xiàng)目(OCP)開(kāi)發(fā)的Open Rack v3(Orv3)標(biāo)準(zhǔn)旨在支持更高功率密度,并在靈活、可擴(kuò)展的機(jī)架中實(shí)現(xiàn)液冷等先進(jìn)功能,以適應(yīng)不斷發(fā)展的AI和高性能計(jì)算(HPC)工作負(fù)載,同時(shí)兼容各種IT設(shè)備。在這一標(biāo)準(zhǔn)下,每個(gè)集成機(jī)架均可視為一個(gè)每個(gè)集成機(jī)架均可視為一個(gè)獨(dú)立“單元”。但兆瓦級(jí)機(jī)架的出現(xiàn),正在打破這一傳統(tǒng)范式。
ORv3機(jī)架最初設(shè)計(jì)的單架功率支持范圍為18千瓦至36千瓦,至今仍是眾多工作負(fù)載的行業(yè)標(biāo)桿,但已無(wú)法滿足即將普及的兆瓦級(jí)機(jī)架需求。1兆瓦IT機(jī)架的設(shè)計(jì)規(guī)劃已超出標(biāo)準(zhǔn)ORv3標(biāo)準(zhǔn)的極限,這不僅需要對(duì)原有設(shè)計(jì)進(jìn)行大幅調(diào)整,還需采用“側(cè)掛車”來(lái)應(yīng)對(duì)電力和冷卻需求。
正因如此,一些超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商正聯(lián)合起來(lái),在開(kāi)放計(jì)算項(xiàng)目(OCP)的支持下共同開(kāi)發(fā)Mt. Diablo標(biāo)準(zhǔn),例如全新的電力機(jī)架規(guī)范,該規(guī)范支持高壓直流供電基礎(chǔ)設(shè)施和每機(jī)架1兆瓦的IT負(fù)載,并通過(guò)將電力、冷卻和IT設(shè)備解耦,進(jìn)一步提升各項(xiàng)功能的利用率。與以往單個(gè)機(jī)架獨(dú)立運(yùn)行不同,如今冷卻液分配單元(CDU)、電力分配單元(PUD)和IT機(jī)架(一個(gè)或多個(gè))共同構(gòu)成支撐工作負(fù)載的集合單元,而冷卻液分配單元(CDU)和電力分配單元(PUD)就成了IT機(jī)架的“側(cè)掛車”。偉創(chuàng)力全新推出的AI基礎(chǔ)設(shè)施平臺(tái)便是絕佳例證,它將電力、冷卻與計(jì)算整合到預(yù)先設(shè)計(jì)的模塊化參考方案中,專為下一代數(shù)據(jù)中心量身打造。
“圍墻”正在倒下
隨著數(shù)據(jù)中心轉(zhuǎn)向采用更高電壓和先進(jìn)的液體冷卻技術(shù)來(lái)支持1兆瓦機(jī)架,電力轉(zhuǎn)換、電力分配以及風(fēng)冷環(huán)境所需設(shè)備的占用空間將大幅縮減。
![]()
一場(chǎng)徹底的變革正在發(fā)生,未來(lái)十年內(nèi)將全面重塑人工智能數(shù)據(jù)中心基礎(chǔ)設(shè)施。獨(dú)立的電源柜和冷卻液分配單元(CDU)將為IT機(jī)架釋放出更多計(jì)算空間,這意味著處理工作負(fù)載所需的IT機(jī)架數(shù)量更少、密度更高、性能更強(qiáng)。此外,"側(cè)掛車"可以同時(shí)為多個(gè)專用計(jì)算機(jī)架供電和散熱,無(wú)需再為每個(gè)機(jī)架配備獨(dú)立的電力和冷卻系統(tǒng)。這將釋放出更多空間,為后續(xù)的創(chuàng)新提供廣闊的空間。
隨著IT機(jī)架、電力和冷卻單元變得更加集中、強(qiáng)大和高效,分隔“灰色空間”(電力機(jī)房)與“白色空間”(數(shù)據(jù)大廳)的“圍墻”正逐漸消失,這種轉(zhuǎn)變意義深遠(yuǎn)。據(jù)我們估計(jì),下一代數(shù)據(jù)中心僅需當(dāng)前10%的空間,就能實(shí)現(xiàn)同等的算力輸出,且效率更高。
超大規(guī)模數(shù)據(jù)中心運(yùn)營(yíng)商將如何利用這些新增的可用空間?他們很可能會(huì)選擇提升千兆級(jí)數(shù)據(jù)中心的計(jì)算密度,但這還有待觀察。不過(guò)可以確定的是,既然更小空間內(nèi)能實(shí)現(xiàn)更多功能,他們也可能選擇縮減數(shù)據(jù)中心規(guī)模,降低建設(shè)資本支出。無(wú)論選擇哪條路徑,這場(chǎng)變革既是發(fā)展的助推器,也是全新機(jī)遇。我們熱切期待與行業(yè)伙伴攜手合作,共同推動(dòng)AI時(shí)代的基礎(chǔ)設(shè)施創(chuàng)新以及相關(guān)產(chǎn)品研發(fā)。我們大膽預(yù)測(cè):即使AI時(shí)代數(shù)據(jù)中心對(duì)電力、算力和冷卻的需求持續(xù)攀升,仍能實(shí)現(xiàn)更高的運(yùn)營(yíng)效率、更低的運(yùn)營(yíng)成本和更強(qiáng)的系統(tǒng)韌性——這無(wú)疑是一場(chǎng)極具積極意義的變革。
About the Author:
關(guān)于作者:
![]()
Chris Butler 是偉創(chuàng)力關(guān)鍵電源與嵌入式電源事業(yè)部總裁。
![]()
Rob Campbell是偉創(chuàng)力通信、企業(yè)和云事業(yè)部總裁。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.