知名科技雜志《連線》創(chuàng)始主編凱文·凱利曾預(yù)測:“在未來的 100 年里,人工智能將超越任何一種人工力量,將人類引領(lǐng)到一個(gè)前所未有的時(shí)代。”
確實(shí)如此,猶如歷史上蒸汽機(jī)、電力、計(jì)算機(jī)和互聯(lián)網(wǎng)等通用技術(shù)一樣,近20年來,AI正以史無前例的速度和深度改變著人類社會(huì)和經(jīng)濟(jì),為釋放人類創(chuàng)造力和促進(jìn)經(jīng)濟(jì)增長提供了巨大的機(jī)會(huì),同時(shí)也成為了驅(qū)動(dòng)新一輪科技和產(chǎn)業(yè)變革的重要?jiǎng)恿υ慈?/p>
特別是隨著千億級(jí)參數(shù)大模型的不斷涌現(xiàn),多樣性算力需求進(jìn)一步增長,數(shù)據(jù)作為推動(dòng)AI發(fā)展的核心生產(chǎn)要素,其所釋放出的價(jià)值日益凸顯。從某種程度上來說,數(shù)據(jù)規(guī)模及質(zhì)量決定了AI智能的高度,也決定了AI在千行萬業(yè)的應(yīng)用成熟度。也正因此,構(gòu)建Storage for AI,打造更高效、更可靠的存力底座已變得至關(guān)重要。
![]()
在此背景之下,在華為全聯(lián)接大會(huì)2024期間,華為重磅推出全新的AI存儲(chǔ)OceanStor A800,使能AI大模型訓(xùn)練和推理,可以說真正釋放了先進(jìn)數(shù)據(jù)存力,鑄就了數(shù)智時(shí)代的根基。
客觀地說,在全新的AI時(shí)代,存儲(chǔ)市場正在隨著新技術(shù)、新應(yīng)用、新介質(zhì)的出現(xiàn)而不斷進(jìn)化和改變,而在此過程中,華為不僅以前所未有的前瞻力、創(chuàng)新力和產(chǎn)品力,重新定義了整個(gè)AI存儲(chǔ)未來發(fā)展的新方向和新趨勢,同時(shí)也讓AI能夠真正“扎根”于千行萬業(yè)奠定了關(guān)鍵基礎(chǔ),而在這背后更是華為數(shù)據(jù)存儲(chǔ)一直以來領(lǐng)先于時(shí)代,更創(chuàng)造時(shí)代的真實(shí)寫照。
01.
AI時(shí)代存儲(chǔ)變化新趨勢
從2023年的ChatGPT,到2024年的Sora,生成式AI和大模型技術(shù)正以不可思議的發(fā)展速度顛覆著我們的認(rèn)知,而剛剛過去的一年,“百模大戰(zhàn)”更讓大模型站上了市場“風(fēng)口”。根據(jù)第三方數(shù)據(jù)顯示,2023年中國人工智能產(chǎn)業(yè)規(guī)模已達(dá)到2137億元,預(yù)計(jì)到2028年,中國人工智能產(chǎn)業(yè)規(guī)模將達(dá)到8110億元,五年復(fù)合增長率達(dá)到30.6%。
可以看到,國家目前正積極從政策“牽引”以及基礎(chǔ)設(shè)施投資角度,開展智算中心建設(shè),推動(dòng)AI數(shù)據(jù)標(biāo)準(zhǔn)建立,推動(dòng)AI大模型賦能行業(yè)應(yīng)用;與此同時(shí),越來越多的中國企業(yè)也積極擁抱AI,希望獲取新技術(shù)浪潮帶來的先發(fā)優(yōu)勢,讓生成式AI和大模型技術(shù)迸發(fā)出來的創(chuàng)新性數(shù)字生產(chǎn)力,幫助企業(yè)釋放出更多的新質(zhì)生產(chǎn)力。
但與此同時(shí),AI爆發(fā)式增長,讓承載關(guān)鍵數(shù)據(jù)的“存力底座”變得更加至關(guān)重要,但傳統(tǒng)存儲(chǔ)系統(tǒng)目前已很難滿足企業(yè)未來數(shù)據(jù)增長以及實(shí)現(xiàn)企業(yè)新質(zhì)生產(chǎn)力提升的要求。因此,構(gòu)筑更高效、更可靠的AI存力底座不僅是“趨勢所在”,更是“迫在眉睫”。
![]()
華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰
在華為公司副總裁、數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰看來,AI時(shí)代,存儲(chǔ)市場正在發(fā)生全新的變化,具體來說:
一是,規(guī)模定律(Scaling Law)下需要XPU與存儲(chǔ)的超大帶寬和極致性能。
Scaling Law揭示了AI人工智能在當(dāng)前深度學(xué)習(xí)算法框架下,算力和數(shù)據(jù)之間 的關(guān)系,即更強(qiáng)的算力加上更多的有效訓(xùn)練數(shù)據(jù),才可以得到更好的AI大模型。因此,對于存力底座而言,就需要能夠快速的將數(shù)據(jù)供給整個(gè)系統(tǒng),而這背后需要存儲(chǔ)具備更大的帶寬,更大的吞吐量。
二是,隨著AI算力集群規(guī)模的持續(xù)增長,故障中斷次數(shù)及恢復(fù)所需時(shí)間呈指數(shù)級(jí)增長,如何提升算力集群的可用度變得越來越重要。
眾所周知,當(dāng)前AI算力集群正規(guī)模增長,而相鄰訓(xùn)練中斷的間隔時(shí)間也越來越短,這就帶來了更加頻繁的 Checkpoint 存檔,同時(shí)也帶來了更加頻繁的斷點(diǎn)續(xù)訓(xùn),因此亟需加速數(shù)據(jù)訪問性能以快速完成Checkpoint的保存與加載。換句話說,這就對存力底座的架構(gòu)創(chuàng)新以及可擴(kuò)展性提出了更高的要求。
三是,目前AI也正從訓(xùn)練走向推理,這也要求需要有全新的數(shù)據(jù)范式與之相匹配,才能更好地推動(dòng)AI進(jìn)入千行萬業(yè)。
可以看到,超長序列正成為大模型推理的主流技術(shù)選擇,但超長序列也面臨諸多挑戰(zhàn),例如推理算力成為瓶頸,推理響應(yīng)緩慢等。因此,無損成為人們在實(shí)現(xiàn)長序列過程中的焦點(diǎn)。
為實(shí)現(xiàn)無損長序列,人們一方面注意到單服務(wù)器推理模式已經(jīng)很難滿足業(yè)務(wù)訴求,推理走向集群化成為必然選擇;另一方面模擬人腦的快慢思考方式, 基于強(qiáng)一致性的外置獨(dú)立存儲(chǔ),構(gòu)建多層KV-Cache等技術(shù),幫助推理集群具備長記憶能力,在推理集群內(nèi)以存代算、過程結(jié)果共享,減少推理算力壓力也正在成為新的趨勢。
![]()
周躍峰說:“傳統(tǒng)存儲(chǔ)時(shí)代,大家更加關(guān)注存儲(chǔ)的性能、可靠性和數(shù)據(jù)范式,但是在‘Storage for AI’時(shí)代,具備極致性能、高擴(kuò)展性、數(shù)據(jù)韌性、可持續(xù)發(fā)展、新數(shù)據(jù)范式以及數(shù)據(jù)編織能力的數(shù)據(jù)存儲(chǔ),才是通往AI數(shù)智時(shí)代的必由之路。不僅如此,AI要持續(xù)發(fā)展并走向千行萬業(yè),存、算、網(wǎng)絡(luò)也要協(xié)同發(fā)展,由此讓整個(gè)系統(tǒng)真正實(shí)現(xiàn)高效、綠色以及成本更低,才能推動(dòng)AI實(shí)現(xiàn)健康的商業(yè)正循環(huán)。”
不難發(fā)現(xiàn),AI快速的演進(jìn)和進(jìn)化讓作為關(guān)鍵支撐的存力底座,無論從供給的水平上,還是技術(shù)創(chuàng)新的能力上,都要有所創(chuàng)新和突破,而這也意味著唯有打造面向“Storage for AI”的存力底座,才能更好的推動(dòng)千行萬業(yè)擁抱AI新時(shí)代。
02.
構(gòu)筑先進(jìn)AI存力底座
也正是洞察到這種全新的市場變化,華為重磅推出了全新AI存儲(chǔ)OceanStor A800,以長記憶內(nèi)存新范式全面提升AI大模型訓(xùn)練和推理能力,并在集群性能、新數(shù)據(jù)范式上實(shí)現(xiàn)了跨越式提升,不僅能夠更好助力千行萬業(yè)大步邁入數(shù)智時(shí)代,更為未來AI存儲(chǔ)的進(jìn)化和演進(jìn)指明了新的創(chuàng)新方向。
![]()
首先,在集群性能方面,OceanStor A800通過構(gòu)建前端網(wǎng)卡全共享、控制器與后端SSD盤全互聯(lián)的技術(shù)架構(gòu),單套存儲(chǔ)設(shè)備可支持10萬卡級(jí)集群全互聯(lián)的大模型訓(xùn)練。數(shù)據(jù)顯示,一套OceanStor A800存儲(chǔ)最多可實(shí)現(xiàn)與19.2萬卡訓(xùn)練集群的靜態(tài)全連接,性能提升40%,空間占用降低80%。
其次,在算力可用度方面,OceanStor A800也將AI集群的可用度提升了30%,真正實(shí)現(xiàn)了“以存強(qiáng)算”。例如,中國移動(dòng)將華為OceanStor AI存儲(chǔ)用于大模型訓(xùn)練,就實(shí)現(xiàn)了150PB單存儲(chǔ)集群、8TB/s帶寬和2.3億IOPS的能力,集群可用度提升32%,為后續(xù)更大規(guī)模大模型訓(xùn)練提供有力支撐。
![]()
最后,在推理體驗(yàn)方面,OceanStor A800作為業(yè)界首款提供長記憶能力的存儲(chǔ),還創(chuàng)新性的采用了多級(jí)KV緩存機(jī)制,將KV-Cache持久化保存并高效使用,讓大模型推理具備長記憶能力,減少在Prefill階段的重復(fù)計(jì)算,客戶推理時(shí)延降低78%,單個(gè)xPU卡的吞吐量提升67%,大幅提升推理體驗(yàn)的同時(shí)也讓成本的大幅降低,讓“以存代算”成為現(xiàn)實(shí)。
對此,周躍峰強(qiáng)調(diào)說:“長記憶內(nèi)存型存儲(chǔ)是一個(gè)非常新的名詞,其核心的技術(shù)創(chuàng)新點(diǎn)是將內(nèi)存和存儲(chǔ)做了分級(jí)處理,讓存儲(chǔ)系統(tǒng)的每一次思考過程以及相關(guān)的結(jié)果都會(huì)記下來。這樣未來用戶有相同的問題系統(tǒng)就不需要再算了,而可以直接從系統(tǒng)中取出來,通過以存代算,讓整個(gè)存儲(chǔ)系統(tǒng)更便宜、更快,更好的使能長上下文。”
由此可見,在AI大模型正從訓(xùn)練走向推理的今天,華為始終圍繞未來數(shù)據(jù)演進(jìn)和企業(yè)對于AI應(yīng)用的核心需求,發(fā)布了全新的AI存儲(chǔ)OceanStor A800,可以說不但能夠更好地幫助企業(yè)應(yīng)對AI時(shí)代對于“存力底座”的要求和挑戰(zhàn),更為AI應(yīng)用真正“扎根”于千行萬業(yè),激發(fā)企業(yè)的新質(zhì)生產(chǎn)力加裝了“新引擎”。
03.
引領(lǐng)時(shí)代更創(chuàng)造時(shí)代
回頭來看,華為之所以持續(xù)引領(lǐng)存儲(chǔ)市場以及存力底座的進(jìn)化和演進(jìn),歸根結(jié)底在于其始終堅(jiān)持不斷地“創(chuàng)新求變”,這是華為不斷取得千行萬業(yè)用戶認(rèn)可的根本所在,同樣也是它始終能夠成為存儲(chǔ)市場領(lǐng)導(dǎo)者的關(guān)鍵所在,更是其引領(lǐng)時(shí)代更創(chuàng)造時(shí)代的真實(shí)印證,我們可以從三個(gè)維度來做更為具體的觀察:
第一,是華為存儲(chǔ)始終堅(jiān)持技術(shù)創(chuàng)新,由此保證了它在產(chǎn)品和技術(shù)上的領(lǐng)先性和先進(jìn)性。
以最新發(fā)布的OceanStor A800 為例,其不僅采用了前沿的數(shù)控分離架構(gòu),提供了前所未有的10TB級(jí)帶寬和億級(jí)IOPS處理能力,更在混合負(fù)載環(huán)境下展現(xiàn)出卓越的高性能表現(xiàn),有效提升了集群的可用性和穩(wěn)定性。
OceanStor A800另一大亮點(diǎn)在于其內(nèi)置的“ModelEngine”技術(shù),該技術(shù)能夠顯著加速數(shù)據(jù)預(yù)處理過程,從而大幅縮短AI訓(xùn)練周期,提升整體訓(xùn)練效率。更為關(guān)鍵的是,在推理場景中,該存儲(chǔ)系統(tǒng)支持RAG向量數(shù)據(jù)庫,并借助KV-Cache技術(shù)賦予AI大模型“記憶”能力,實(shí)現(xiàn)“以存代算”,不僅提升了推理速度,更在保障推理準(zhǔn)確度的同時(shí),為行業(yè)用戶帶來更加流暢、精準(zhǔn)的推理體驗(yàn),真正領(lǐng)跑了AI存儲(chǔ)時(shí)代。
第二,是華為在存儲(chǔ)領(lǐng)域的優(yōu)勢不僅建立在對技術(shù)和產(chǎn)品的創(chuàng)新上,對企業(yè)客戶關(guān)鍵需求的深刻理解和洞察,也讓華為打造出了很多“標(biāo)桿級(jí)”的客戶案例和落地的方案,由此也為中國企業(yè)更好地實(shí)現(xiàn)數(shù)智化轉(zhuǎn)型,更快的擁抱AI時(shí)代提供了有價(jià)值的借鑒和參考。
![]()
比如,在華為全聯(lián)接大會(huì)2024期間,華為與中國移動(dòng)重磅發(fā)布了智算中心超大規(guī)模集群AI存儲(chǔ)解決方案,該方案在業(yè)界大規(guī)模部署了多協(xié)議融合存儲(chǔ),真正支撐了千億級(jí)參數(shù)規(guī)模大模型高效訓(xùn)練。
周躍峰表示:“這次華為和中國移動(dòng)的聯(lián)合創(chuàng)新和落地實(shí)踐,相當(dāng)于給產(chǎn)業(yè)界做了一次Benchmark,至少做了第一個(gè)階段的Benchmark,其系統(tǒng)性能是能夠超過外國很多AI系統(tǒng)的,這不僅證明了華為AI存儲(chǔ)的強(qiáng)大性能以及技術(shù)的領(lǐng)先性,同時(shí)也說明了未來存、算、網(wǎng)三者要協(xié)同發(fā)展,才能更好的滿足AI不斷規(guī)模化增長的需求。”
三是,是華為在存儲(chǔ)市場中一以貫之對客戶存儲(chǔ)投資保護(hù)的高度重視和關(guān)注,也讓其在企業(yè)通往AI的道路上,構(gòu)建出了更為強(qiáng)大的安全保障。
可以看到,當(dāng)前企業(yè)在數(shù)智化的過程中,既產(chǎn)生出了更多高價(jià)值的業(yè)務(wù)數(shù)據(jù),但也大幅降低了黑客門檻,讓勒索攻擊更加頻繁。因此,不管是產(chǎn)生了更多數(shù)據(jù)的數(shù)字化,還是持續(xù)成長的智能化,均需要在數(shù)據(jù)基礎(chǔ)設(shè)施層面構(gòu)建防治結(jié)合的數(shù)據(jù)安全體系。
基于此,華為積極構(gòu)建存儲(chǔ)內(nèi)生安全能力,通過新增勒索病毒檢測能力,并推出OceanCyber數(shù)據(jù)安全卡。只要安裝上數(shù)據(jù)安全卡,原有產(chǎn)品同樣具備勒索病毒檢測能力;同時(shí),通過設(shè)置誘餌文件,勒索攻擊偵測準(zhǔn)確率高達(dá)99.9%;此外,通過搭載DME數(shù)據(jù)管理引擎,還能夠?qū)崿F(xiàn)對AI集群的精準(zhǔn)安全策略管理,讓存力底座真正從被動(dòng)應(yīng)對攻擊走向主動(dòng)的全面防護(hù)。
正如周躍峰最后所言:“數(shù)據(jù)安全是0和1的關(guān)系,勒索攻擊導(dǎo)致的數(shù)據(jù)丟失對于企業(yè)會(huì)產(chǎn)生非常大的威脅和損失,但是今天大量的廠商、企業(yè)在構(gòu)建存儲(chǔ)系統(tǒng)的時(shí)候并沒有把其中的安全特性作為一個(gè)重要的技術(shù)要求,因此華為認(rèn)為未來存儲(chǔ)系統(tǒng)集成數(shù)據(jù)安全的功能將變得非常重要,也將變得勢在必行,由此才能更好地支撐企業(yè)的AI應(yīng)用,促進(jìn)AI在千行萬業(yè)落地。”
全文總結(jié),在數(shù)據(jù)驅(qū)動(dòng)的AI新紀(jì)元,華為重磅推出全新的AI存儲(chǔ)OceanStor A800,為千行萬業(yè)構(gòu)筑出了堅(jiān)實(shí)的AI先進(jìn)存力底座,為企業(yè)走向AI新時(shí)代按下了“快進(jìn)鍵”,相信必將會(huì)加速中國企業(yè)和行業(yè)數(shù)智化變革的進(jìn)程,并激發(fā)新質(zhì)生產(chǎn)力的產(chǎn)生,其價(jià)值可謂:“不止于現(xiàn)在,更關(guān)乎未來”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.