(本文編譯自Electronic Design)
在數(shù)字化時(shí)代的浪潮下,數(shù)據(jù)中心作為信息存儲(chǔ)、處理和傳輸?shù)暮诵臉屑~,正經(jīng)歷著迅猛的發(fā)展。隨著信息技術(shù)的飛速進(jìn)步,數(shù)據(jù)中心所承載的業(yè)務(wù)量與日俱增,從傳統(tǒng)的互聯(lián)網(wǎng)服務(wù)到新興的人工智能、大數(shù)據(jù)分析、云計(jì)算等領(lǐng)域,其應(yīng)用范圍不斷拓展。這不僅促使數(shù)據(jù)中心的規(guī)模持續(xù)擴(kuò)大,更使得機(jī)架功率密度急劇攀升。如今,數(shù)據(jù)中心機(jī)架功率密度已突破每架 100 千瓦以上,不斷挑戰(zhàn)著數(shù)據(jù)中心熱設(shè)計(jì)的極限。
功率密度的大幅提升,意味著數(shù)據(jù)中心在單位空間內(nèi)產(chǎn)生的熱量呈幾何倍數(shù)增長(zhǎng)。傳統(tǒng)的散熱方式,如風(fēng)冷技術(shù),在面對(duì)如此高強(qiáng)度的熱量產(chǎn)生時(shí),逐漸顯得力不從心。因此,尋求一種高效、可靠的散熱技術(shù),成為了數(shù)據(jù)中心行業(yè)發(fā)展的當(dāng)務(wù)之急。液冷技術(shù)正是在這樣的背景下應(yīng)運(yùn)而生,它以其卓越的散熱性能,為高密度數(shù)據(jù)中心的散熱難題提供了可行的解決方案。
高性能計(jì)算和人工智能帶來的散熱壓力
近年來,高性能計(jì)算(HPC)和人工智能(AI)技術(shù)的迅猛發(fā)展,為數(shù)據(jù)中心帶來了新的機(jī)遇,但也使其散熱壓力倍增。液冷技術(shù)正迅速成為解決數(shù)據(jù)中心散熱問題的關(guān)鍵方案。目前已有浸沒式、芯片直冷等多種液冷技術(shù),但關(guān)于液冷的諸多誤解仍普遍存在。
如今,大多數(shù)現(xiàn)有供電設(shè)施長(zhǎng)期來看將無法滿足這一需求。僅單塊圖形處理器(GPU)平均每日耗電量就達(dá)54千瓦時(shí),相當(dāng)于普通家庭兩天的用電量。而若擴(kuò)展到5000個(gè)數(shù)據(jù)中心機(jī)架(配備30萬(wàn)塊GPU),其耗電量約能為40萬(wàn)戶家庭供電,規(guī)模堪比美國(guó)得克薩斯州奧斯汀市。如此龐大的耗電量,意味著會(huì)產(chǎn)生海量的熱量。
若冷卻系統(tǒng)無法充分散熱以實(shí)現(xiàn)最大計(jì)算性能(通常只能達(dá)到額定容量的75%以下),將給傳統(tǒng)數(shù)據(jù)中心的暖通空調(diào)(HVAC)設(shè)備帶來沉重負(fù)擔(dān)。軟件仿真技術(shù)可助力優(yōu)化數(shù)據(jù)中心冷卻系統(tǒng)的設(shè)計(jì)。
數(shù)據(jù)中心的液冷解決方案
成功推行液冷解決方案,需要整合來自不同機(jī)構(gòu)的多種技術(shù)。這些系統(tǒng)最好有序協(xié)同安裝,以打造可持續(xù)運(yùn)營(yíng)的數(shù)據(jù)中心。但要找到一家可靠的交鑰匙供應(yīng)商并非易事,這類供應(yīng)商需能全面負(fù)責(zé)方案制定、項(xiàng)目規(guī)劃、協(xié)調(diào)管理,以及現(xiàn)場(chǎng)所有各類技術(shù)的安裝,確保系統(tǒng)無縫啟動(dòng)。
系統(tǒng)安裝完成后,終端用戶的維護(hù)工作可能相對(duì)復(fù)雜。盡管液冷解決方案的采用率正在攀升,但大多數(shù)數(shù)據(jù)中心技術(shù)人員并未接受過充分培訓(xùn),無法熟練操作液冷硬件及掌握必要的組件維護(hù)技能。
設(shè)計(jì)師在評(píng)估液冷解決方案前,必須明確自身的目標(biāo)與訴求。下一步應(yīng)制定計(jì)劃,對(duì)數(shù)據(jù)中心項(xiàng)目及其現(xiàn)有設(shè)備或目標(biāo)新設(shè)備展開詳細(xì)審計(jì),這將有助于明確設(shè)備要求與場(chǎng)地條件。
之后,需準(zhǔn)備好清晰闡述自身目標(biāo),并篩選出最優(yōu)的單一來源供應(yīng)商。該供應(yīng)商應(yīng)不偏袒原始設(shè)備制造商(OEM),且精通多種液冷技術(shù)。
單一來源合作伙伴需具備以下能力:主導(dǎo)初期方案規(guī)格制定與范圍界定、采購(gòu)用戶指定技術(shù);提供現(xiàn)場(chǎng)項(xiàng)目管理與安裝服務(wù)、完成服務(wù)器的安裝調(diào)試;為新系統(tǒng)提供全生命周期維護(hù)。若設(shè)計(jì)師同時(shí)評(píng)估多家解決方案供應(yīng)商,需記得向每家索取總擁有成本(TCO)匯總報(bào)告,以進(jìn)行真實(shí)、可靠的對(duì)比。
常見液冷技術(shù)介紹
液冷技術(shù)適用場(chǎng)景廣泛、應(yīng)用范圍全面,但安裝過程較為復(fù)雜。
后門熱交換器(RDHX)
后門熱交換器(RDHX)是一種在數(shù)據(jù)中心中應(yīng)用較為廣泛的液冷技術(shù)。其工作原理是將熱交換器直接安裝在服務(wù)器機(jī)架的后門位置,通過冷卻液在熱交換器內(nèi)部的循環(huán)流動(dòng),吸收服務(wù)器排出的熱空氣的熱量,從而實(shí)現(xiàn)對(duì)服務(wù)器的冷卻。后門熱交換器(RDHX)是最常用的技術(shù)之一,它是侵入性最低的液冷解決方案,可對(duì)現(xiàn)有機(jī)架系統(tǒng)進(jìn)行改造升級(jí)。
芯片直冷技術(shù)(DTC)
芯片直冷技術(shù)(DTC)又稱冷板液冷或直接液冷(DLC)。其原理是通過將冷卻液直接傳導(dǎo)至服務(wù)器組件,如CPU、GPU等芯片表面,利用冷卻液的高比熱容和良好的熱傳導(dǎo)性能,迅速將芯片產(chǎn)生的熱量帶走,并通過循環(huán)系統(tǒng)將熱量傳遞出去,實(shí)現(xiàn)對(duì)芯片的有效冷卻。該技術(shù)對(duì)安裝人員要求更高、操作更復(fù)雜,但冷卻效率更高,且能支持更高的機(jī)架密度。
單相浸沒式冷卻技術(shù)
第三種方案是全液浸冷卻,即單相浸沒式冷卻技術(shù)。它將服務(wù)器或電子組件完全浸沒在具有導(dǎo)熱性且不導(dǎo)電的液態(tài)介電質(zhì)中,以介電質(zhì)作為冷卻劑來實(shí)現(xiàn)散熱的一種先進(jìn)液冷技術(shù)。全液浸冷卻的安裝復(fù)雜度遠(yuǎn)高于前兩者,但相比后門熱交換器和芯片直冷技術(shù)具有顯著優(yōu)勢(shì),比如能實(shí)現(xiàn)最高冷卻效率和最優(yōu)計(jì)算性能。同時(shí),它還能大幅降低數(shù)據(jù)中心對(duì)暖通空調(diào)系統(tǒng)的需求,減少機(jī)房環(huán)境噪音,改善工作人員操作體驗(yàn)。
這種技術(shù)也被稱為開式槽浸沒冷卻,將服務(wù)器或電子組件浸入具有導(dǎo)熱性且不導(dǎo)電的液態(tài)介電質(zhì)中,以該介電質(zhì)作為冷卻劑,防止電路放電。這種不導(dǎo)電的液態(tài)介電液能吸收組件產(chǎn)生的熱量,且因?qū)儆趩蜗嗉夹g(shù),在整個(gè)冷卻過程中始終保持液態(tài)。
介電冷卻劑是一種可傳遞電場(chǎng)力但不導(dǎo)電的介質(zhì),常見例子包括礦物油或去離子水系統(tǒng)。
冷卻劑與浸沒在槽中的發(fā)熱硬件直接接觸,硬件通過熱傳導(dǎo)升高冷卻劑溫度。受熱后的冷卻劑被泵送至熱交換器,經(jīng)冷卻后再回流至開式槽中。冷卻塔就是熱交換器的一種類型。
單相冷卻系統(tǒng)維護(hù)成本更低、冷卻劑費(fèi)用更少,且在蒸汽產(chǎn)生和冷卻劑蒸發(fā)方面的問題更少。
單相浸沒式冷卻的優(yōu)缺點(diǎn)
單相浸沒式冷卻的優(yōu)點(diǎn)包括:
散熱效率高:液體比熱容大,能高效帶走組件熱量,可應(yīng)對(duì)高熱負(fù)荷場(chǎng)景。
冷卻均勻:介電液直接接觸并包裹浸沒的組件,實(shí)現(xiàn)組件整體均勻冷卻。
降低噪音:無需風(fēng)扇或其他氣流驅(qū)動(dòng)裝置,大幅降低環(huán)境噪音水平。
簡(jiǎn)化冷卻設(shè)施:不依賴空氣循環(huán),無需配備風(fēng)扇、空調(diào)機(jī)組或大型冷卻基礎(chǔ)設(shè)施。
環(huán)境適應(yīng)性強(qiáng):系統(tǒng)相對(duì)隔離濕度、灰塵等環(huán)境因素,在惡劣環(huán)境中更具優(yōu)勢(shì)。
該冷卻方式的缺點(diǎn)則如下:
初始部署成本高:浸沒式冷卻基礎(chǔ)設(shè)施造價(jià)不菲,對(duì)現(xiàn)有數(shù)據(jù)中心進(jìn)行改造時(shí)成本尤其高昂。
冷卻液管理復(fù)雜:介電液的選型與管理至關(guān)重要,可能產(chǎn)生較高費(fèi)用,且需確保材料的長(zhǎng)期兼容性與穩(wěn)定性。
維護(hù)與可達(dá)性差:組件維修或更換時(shí)需從冷卻液中取出,給維護(hù)操作帶來不便。
結(jié)語(yǔ)
展望未來,液冷技術(shù)在數(shù)據(jù)中心領(lǐng)域?qū)⒂瓉砀鼮閺V闊的發(fā)展空間。隨著人工智能、大數(shù)據(jù)、云計(jì)算等技術(shù)的持續(xù)發(fā)展,數(shù)據(jù)中心的規(guī)模和功率密度將進(jìn)一步提升,對(duì)液冷技術(shù)的需求也將更加迫切。在技術(shù)發(fā)展方面,液冷技術(shù)將朝著更高效率、更低成本、更智能化的方向發(fā)展。在應(yīng)用方面,液冷技術(shù)的應(yīng)用范圍將不斷擴(kuò)大。不僅在新建的數(shù)據(jù)中心中,液冷技術(shù)將成為主流的散熱方式,而且在對(duì)現(xiàn)有數(shù)據(jù)中心的改造升級(jí)中,液冷技術(shù)也將得到更廣泛的應(yīng)用。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.