今年年初DeepSeek的橫空初始,幾乎在一瞬間就宣告了一個時代的更替,擁抱AI可以說已從過往的技術(shù)選項升維為產(chǎn)業(yè)轉(zhuǎn)型的必選項,更成為了千行萬業(yè)競相布局的數(shù)智化新賽道。
在這場智能化的浪潮中,企業(yè)既需要持續(xù)構(gòu)建更大規(guī)模的數(shù)據(jù)基礎(chǔ)設(shè)施,也需要竭盡所能獲取更多高質(zhì)量行業(yè)數(shù)據(jù),畢竟數(shù)據(jù)的規(guī)模和質(zhì)量決定了AI智能的高度,也決定了AI技術(shù)在實體經(jīng)濟(jì)應(yīng)用場景中的落地效能。
![]()
背后的原因在于,數(shù)據(jù)基礎(chǔ)設(shè)施作為AI技術(shù)的“糧倉”,承載著三重的價值:它是持續(xù)供給高質(zhì)量數(shù)據(jù)養(yǎng)料的戰(zhàn)略儲備池,缺失充沛優(yōu)質(zhì)的數(shù)據(jù)資源,AI的學(xué)習(xí)進(jìn)化能力將大打折扣;同時,其技術(shù)架構(gòu)的先進(jìn)性還直接決定AI大模型的訓(xùn)練效率與迭代速度,這就猶如“高速公路”與“鄉(xiāng)間小道”之間有著本質(zhì)的區(qū)別;更為重要的是,作為數(shù)據(jù)要素的核心“保險庫”,它還是構(gòu)筑數(shù)據(jù)安全風(fēng)險“銅墻鐵壁”的核心防線。
從這個角度來說,打造智能就緒的數(shù)據(jù)基礎(chǔ)設(shè)施,既是推動AI技術(shù)進(jìn)步的必然要求,也是千行萬業(yè)提升整體創(chuàng)新能力、實現(xiàn)數(shù)智化轉(zhuǎn)型的關(guān)鍵選擇。
在此背景下,戴爾科技集團(tuán)通過“與時俱進(jìn)”的創(chuàng)新與迭代,推出基于湖倉一體架構(gòu)的智能數(shù)據(jù)平臺解決方案,該方案通過橫向擴(kuò)展能力實現(xiàn)存力的線性增長,以智能數(shù)據(jù)管理引擎優(yōu)化數(shù)據(jù)全生命周期價值挖掘,更依托安全可信的能力筑牢數(shù)據(jù)安全防線,不僅為智能訓(xùn)練、湖倉一體等前沿應(yīng)用場景提供強大支撐,更助力企業(yè)完成從數(shù)據(jù)到智能的躍遷,在智能時代全速邁向數(shù)據(jù)驅(qū)動的創(chuàng)新之旅。
![]()
01.
打破數(shù)據(jù)孤島,
現(xiàn)代數(shù)據(jù)架構(gòu)“應(yīng)運而生”
可以看到,當(dāng)前企業(yè)的工作負(fù)載正經(jīng)歷著翻天覆地的變化——從傳統(tǒng)的虛擬機、數(shù)據(jù)庫模式,到如今的智能應(yīng)用、機器學(xué)習(xí)、容器和邊緣計算等新技術(shù),企業(yè)得以借助這些新技術(shù)推動業(yè)務(wù)發(fā)展,增強市場競爭力。
然而,企業(yè)在享受新技術(shù)紅利的同時,其數(shù)據(jù)基礎(chǔ)設(shè)施平臺卻面臨著諸多挑戰(zhàn),如建造成本難以預(yù)測、架構(gòu)擴(kuò)展性差、網(wǎng)絡(luò)安全威脅等。這些挑戰(zhàn)推動著企業(yè)對更高效資源利用、更智能開放的數(shù)據(jù)基礎(chǔ)設(shè)施以及更強安全措施的迫切需求。
在此過程中,數(shù)據(jù)已成為企業(yè)的核心戰(zhàn)略資源,其價值甚至超越了傳統(tǒng)意義上的“石油”,特別是數(shù)據(jù)質(zhì)量更成為企業(yè)在數(shù)智化時代實現(xiàn)價值創(chuàng)造與可持續(xù)發(fā)展的核心基石,如高準(zhǔn)確性、完整性和一致性的數(shù)據(jù),為企業(yè)戰(zhàn)略決策的科學(xué)性保駕護(hù)航;實時、可靠的數(shù)據(jù)為運營流程的高效運轉(zhuǎn)提供有力支撐;而優(yōu)質(zhì)數(shù)據(jù)還是智能應(yīng)用落地、產(chǎn)品創(chuàng)新迭代以及合規(guī)管理實施的先決條件。
![]()
但我們也必須清醒地認(rèn)識到,長期存在的“數(shù)據(jù)孤島”問題已成為企業(yè)邁向AI時代的重要阻礙。異構(gòu)系統(tǒng)間的技術(shù)標(biāo)準(zhǔn)差異、部門權(quán)責(zé)割裂以及隱私合規(guī)限制等因素,形成了數(shù)據(jù)流通的“無形壁壘”。這種碎片化的數(shù)據(jù)分布不僅導(dǎo)致AI模型訓(xùn)練面臨樣本偏差和特征缺失的技術(shù)瓶頸,還引發(fā)了組織、技術(shù)和合規(guī)層面的多重矛盾,可以說數(shù)據(jù)孤島帶來的隱性成本“不容小覷”,重復(fù)存儲加劇了算力浪費,分散治理推高了合規(guī)風(fēng)險,而全局洞察力的缺失更使企業(yè)難以應(yīng)對快速變化的市場需求。
除此之外,企業(yè)過往的數(shù)據(jù)架構(gòu)在長期演進(jìn)中形成的“集中化、孤島化、僵化性和專有性”等問題,同樣也成為企業(yè)數(shù)據(jù)驅(qū)動業(yè)務(wù)轉(zhuǎn)型的另一重障礙。典型的如集中式設(shè)計引發(fā)性能瓶頸和單點故障風(fēng)險,數(shù)據(jù)隔離阻礙了企業(yè)內(nèi)的無縫數(shù)據(jù)共享與業(yè)務(wù)協(xié)作,架構(gòu)僵化難以適應(yīng)動態(tài)需求,技術(shù)綁定則推高構(gòu)建成本、限制了技術(shù)創(chuàng)新等等。
![]()
為了打破這一困局,現(xiàn)代數(shù)據(jù)架構(gòu)“應(yīng)運而生”,其以開放、安全、靈活為核心,致力于打破數(shù)據(jù)壁壘,促進(jìn)數(shù)據(jù)跨部門流通,通過分布式設(shè)計提升性能與可靠性,擺脫單點依賴;以彈性架構(gòu)適配業(yè)務(wù)變化,降低技術(shù)成本。更為關(guān)鍵的是,基于現(xiàn)代數(shù)據(jù)架構(gòu),能夠讓數(shù)據(jù)從“資源孤島”蛻變?yōu)椤皟r值活水”,助力企業(yè)在數(shù)智化浪潮中重構(gòu)競爭力,開啟數(shù)據(jù)驅(qū)動的增長新模式。
02.
就緒數(shù)據(jù)底座,
筑牢智能數(shù)據(jù)平臺驅(qū)動創(chuàng)新
也正是洞察到這種需求變化,戴爾科技集團(tuán)在開放、靈活和安全的架構(gòu)上,打造智能數(shù)據(jù)平臺解決方案,該平臺秉持五大核心設(shè)計宗旨,致力于為企業(yè)打造一個高效、靈活且極具創(chuàng)新性的數(shù)據(jù)環(huán)境,助力企業(yè)在數(shù)字化浪潮中脫穎而出。
一是,更容易的數(shù)據(jù)訪問和洞察,賦予企業(yè)業(yè)務(wù)部門和數(shù)據(jù)團(tuán)隊自助式訪問權(quán),推動業(yè)務(wù)創(chuàng)新;二是,增強的數(shù)據(jù)策略,通過豐富元數(shù)據(jù)、合并數(shù)據(jù)源,確保更準(zhǔn)確的洞察,提高數(shù)據(jù)可發(fā)現(xiàn)性;三是,更可控的數(shù)據(jù)存儲與管理,利用開放格式和行業(yè)標(biāo)準(zhǔn),增強快速高效搜索非結(jié)構(gòu)化數(shù)據(jù)的能力;四是,簡化且統(tǒng)一的數(shù)據(jù)存儲平臺,通過單個命名空間和多協(xié)議支持提供通用訪問;五是,針對智能應(yīng)用和數(shù)據(jù)工作負(fù)載優(yōu)化,采用高性能、可擴(kuò)展、可用性和安全性架構(gòu),確保企業(yè)無縫運營。
![]()
值得一提的是,戴爾科技智能數(shù)據(jù)平臺解決方案在存力底座方面可以采用智能就緒型存儲平臺PowerScale以及第四代對象存儲平臺ObjectScale。
其中,PowerScale自2020年正式從Isilon更名煥新以來,一直以橫向擴(kuò)展的存儲架構(gòu),以及高性能、高擴(kuò)展、高可靠能力為非結(jié)構(gòu)化存儲樹立了新的標(biāo)桿,成為了智能時代關(guān)鍵的數(shù)據(jù)基礎(chǔ)設(shè)施,其核心的優(yōu)勢主要體現(xiàn)在三個維度:
首先,靈活擴(kuò)展,輕松應(yīng)對數(shù)據(jù)增長。PowerScale 具備出色的擴(kuò)展能力,企業(yè)可以從小規(guī)模起步,隨著業(yè)務(wù)的增長逐步擴(kuò)展至 PB 級存儲容量,且整個擴(kuò)容過程無需停機,確保業(yè)務(wù)的連續(xù)性,并僅需60秒即可完成新節(jié)點的添加,大大減少了擴(kuò)容所需的時間和人力成本。整個集群還可通過一個統(tǒng)一的管理界面進(jìn)行輕松管理,降低了管理的復(fù)雜性和難度,讓企業(yè)能夠更加專注于核心業(yè)務(wù)。
與此同時,PowerScale還是全球率先通過NVIDIA DGX SuperPOD驗證的以太網(wǎng)存儲解決方案,能夠提供GPU Direct Storage 的支持,該功能可以讓GPU直接訪問存儲數(shù)據(jù),減少了數(shù)據(jù)路徑,降低了數(shù)據(jù)訪問延遲,從而有效縮短了訓(xùn)練時間,提高了GPU利用率。因此,對于需要進(jìn)行智能訓(xùn)練工作負(fù)載的企業(yè)來說,這一功能能夠顯著提升訓(xùn)練效率,加速模型的迭代和優(yōu)化。
![]()
在近期舉辦的2025戴爾科技全球峰會(DTW)上,戴爾科技也基于OneFS 9.11的全新升級發(fā)布了新一代全閃存PowerScale平臺的最新成員PowerScale F910,其和稍早前發(fā)布的PowerScale F710,均提供了新的122TB驅(qū)動器選項,能夠?qū)崿F(xiàn)單個節(jié)點最大2.9PB 的裸容量密度,滿足了企業(yè)對性能和容量的雙重需求。同時,針對混合平臺也進(jìn)行了容量、成本、性能的優(yōu)化,為企業(yè)提供了更多選擇,以適應(yīng)不同的業(yè)務(wù)場景和預(yù)算要求。
其次,深度集成,滿足多樣化工作負(fù)載。為提高存儲利用率,PowerScale 提供了高速線內(nèi)數(shù)據(jù)壓縮和重復(fù)數(shù)據(jù)消除功能。通過這些技術(shù),企業(yè)可以在不增加存儲硬件成本的情況下,存儲更多的數(shù)據(jù),有效節(jié)省了存儲空間和成本。此外,其單個數(shù)據(jù)湖的架構(gòu)打破了數(shù)據(jù)孤島,實現(xiàn)了數(shù)據(jù)的集中存儲和管理,提高了數(shù)據(jù)的共享和利用效率,為企業(yè)決策提供了更全面、準(zhǔn)確的數(shù)據(jù)支持。
在多協(xié)議支持方面,PowerScale 支持多種訪問協(xié)議,如 NFS、SMB、HDFS、S3 等,能夠?qū)ν还蚕頂?shù)據(jù)池進(jìn)行統(tǒng)一訪問。這意味著用戶可以根據(jù)不同的工作負(fù)載和應(yīng)用程序需求,選擇合適的協(xié)議來訪問數(shù)據(jù),無需進(jìn)行復(fù)雜的數(shù)據(jù)遷移和轉(zhuǎn)換。這種多協(xié)議支持的能力,使得 PowerScale 能夠適應(yīng)各種復(fù)雜的企業(yè)環(huán)境,滿足不同業(yè)務(wù)場景下的數(shù)據(jù)訪問需求。
在數(shù)據(jù)安全方面,PowerScale 提供了企業(yè)級可用性、冗余度和安全性。除了本地數(shù)據(jù)保護(hù)措施外,還支持異地復(fù)制,將關(guān)鍵數(shù)據(jù)資產(chǎn)復(fù)制到其他地理位置,以防范因自然災(zāi)害、訪問中斷和網(wǎng)絡(luò)攻擊等原因?qū)е碌臄?shù)據(jù)丟失。同時,PowerScale 還提供勒索軟件保護(hù)和數(shù)據(jù)避風(fēng)港解決方案,為企業(yè)的數(shù)據(jù)安全提供了全方位的保障,讓企業(yè)能夠安心應(yīng)對各種安全威脅。
最后,能力增強,提升數(shù)據(jù)發(fā)現(xiàn)與管理能力。PowerScale 的存儲和數(shù)據(jù)管理產(chǎn)品組合能夠與業(yè)務(wù)應(yīng)用程序無縫配合,為數(shù)據(jù)工程、數(shù)據(jù)科學(xué)、數(shù)據(jù)倉庫和數(shù)據(jù)湖項目提供強大的支持。它支持多種現(xiàn)代數(shù)據(jù)分析應(yīng)用程序,如 Apache Flink、Spark、Hadoop、Dremio、Databricks 等,以及與 Adobe、NVIDIA、AMD 等行業(yè)領(lǐng)先企業(yè)的合作,使得企業(yè)能夠充分利用這些工具和技術(shù),深入挖掘數(shù)據(jù)價值,推動業(yè)務(wù)創(chuàng)新和發(fā)展。
此外,PowerScale 提供的 MetadataIQ 框架增強了元數(shù)據(jù)功能,使客戶能夠根據(jù)工作流和分析需求發(fā)現(xiàn)所需數(shù)據(jù)并編制索引。元數(shù)據(jù)目錄可用于查詢、數(shù)據(jù)可視化和數(shù)據(jù)生命周期管理,為企業(yè)提供了更強大的數(shù)據(jù)管理和分析能力。當(dāng)客戶添加分析工作流后,可以簡單高效地查詢各處的數(shù)據(jù),增強時效性。同時,MetadataIQ 可以跟蹤數(shù)據(jù)的增量(變更列表),批量解析每個增量中的條目,更新索引數(shù)據(jù)庫,為企業(yè)的非結(jié)構(gòu)化數(shù)據(jù)存儲庫提供全局目錄,方便企業(yè)進(jìn)行全面的數(shù)據(jù)管理和分析。
針對 RAG(檢索增強生成)優(yōu)化,PowerScale 也發(fā)布了開源文檔加載器,支持 LangChain 和 NVIDIA NIM 微服務(wù)。該加載器能夠智能識別和處理變更的數(shù)據(jù),當(dāng)源數(shù)據(jù)存儲在 PowerScale 時,可大幅縮短 RAG 數(shù)據(jù)流水線的攝取時間,并降低計算和 GPU 成本。這一優(yōu)化使得企業(yè)在處理自然語言處理任務(wù)時,能夠更加高效地利用數(shù)據(jù),提升模型的性能和效果。
不難看出,PowerScale以其靈活的橫向擴(kuò)展性、高效的存儲管理、多協(xié)議支持、企業(yè)級安全保障、深度集成能力、智能加速功能、元數(shù)據(jù)增強、RAG 優(yōu)化以及軟硬件升級等諸多優(yōu)勢,當(dāng)之無愧地成為構(gòu)筑數(shù)據(jù)智能平臺的最佳底座選擇。
![]()
除此之外,基于第四代對象存儲平臺ObjectScale打造的戴爾科技智能數(shù)據(jù)平臺解決方案,則具備以下核心優(yōu)勢:
其一,支持橫向擴(kuò)展架構(gòu),應(yīng)對數(shù)據(jù)指數(shù)級增長。平臺采用ObjectScale獨特的橫向擴(kuò)展、跨地域的分布式架構(gòu)設(shè)計,支持從TB到EB級的無縫擴(kuò)容,無論數(shù)據(jù)中心部署在何處,均可輕松應(yīng)對指數(shù)級數(shù)據(jù)增長需求。通過在線添加新節(jié)點的方式,也能實現(xiàn)容量與性能的同步擴(kuò)展,確保業(yè)務(wù)無中斷升級,為企業(yè)的長期數(shù)據(jù)規(guī)劃提供可靠支撐。
其二,智能場景適配,構(gòu)建高效對象數(shù)據(jù)存取。依托ObjectScale的多站點聯(lián)合與云復(fù)制功能,可構(gòu)建全局可訪問的內(nèi)容存儲庫;同時支持在應(yīng)用程序和用戶附近部署存儲節(jié)點,實現(xiàn)就近訪問,最大限度降低延遲并縮短訪問路徑。與此同時,憑借豐富的多協(xié)議支持與互操作性(如S3、S3a、NFS等),可構(gòu)建大規(guī)模擴(kuò)展的多用途數(shù)據(jù)湖,為現(xiàn)代應(yīng)用程序及分析應(yīng)用提供高效數(shù)據(jù)支撐。
其三,統(tǒng)一管理與安全防護(hù),保障數(shù)據(jù)全生命周期安全。管理層面,管理員可通過直觀的集中式GUI及內(nèi)置報告工具,輕松管理數(shù)十億對象、數(shù)百個租戶及PB級數(shù)據(jù);同時提供豐富的RESTful管理API,可無縫集成至現(xiàn)有管理解決方案中,實現(xiàn)統(tǒng)一管控;安全層面,ObjectScale集成高級安全功能,包括數(shù)據(jù)加密、增強型日志記錄、ObjectLock等技術(shù),全面保護(hù)企業(yè)核心數(shù)據(jù)資產(chǎn);其基于零信任架構(gòu)設(shè)計,可有效抵御未經(jīng)授權(quán)的訪問、勒索軟件攻擊及其他網(wǎng)絡(luò)風(fēng)險,全方位保障數(shù)據(jù)安全。
![]()
03.
釋放數(shù)據(jù)價值,
助企業(yè)從數(shù)據(jù)到智能的躍遷
除提供智能就緒型存儲底座之外,戴爾智能數(shù)據(jù)平臺方案無論是在應(yīng)用場景、數(shù)據(jù)保護(hù)、模塊化架構(gòu)方面也專門進(jìn)行能力強化,能夠幫助企業(yè)進(jìn)一步釋放數(shù)據(jù)價值,助力企業(yè)實現(xiàn)從數(shù)據(jù)到智能的躍遷。
第一,在應(yīng)用場景方面,戴爾科技智能數(shù)據(jù)平臺配備了數(shù)據(jù)分析引擎和數(shù)據(jù)處理引擎兩大核心組件。數(shù)據(jù)分析引擎采用Starburst技術(shù),具備強大的跨多種數(shù)據(jù)源聯(lián)邦查詢能力;數(shù)據(jù)處理引擎則基于Spark技術(shù),實現(xiàn)了數(shù)據(jù)的大規(guī)模處理。同時,基于戴爾科技智能數(shù)據(jù)平臺構(gòu)筑的數(shù)據(jù)湖倉也采用100%開放格式驅(qū)動,并遵循現(xiàn)代行業(yè)標(biāo)準(zhǔn),內(nèi)置數(shù)據(jù)治理機制,確保數(shù)據(jù)湖倉能夠隨著未來需求的變化而不斷發(fā)展。
![]()
第二,在數(shù)據(jù)保護(hù)方面,戴爾智能數(shù)據(jù)平臺通過全面的保護(hù)策略確保組織數(shù)據(jù)的安全和合規(guī)性。包括存取控制、威脅檢測、數(shù)據(jù)隱藏、數(shù)據(jù)隔離、數(shù)據(jù)加密以及數(shù)據(jù)復(fù)制和移動性等多方面的保護(hù)措施,為企業(yè)數(shù)據(jù)提供了全方位的安全保障。
第三,在模塊化架構(gòu)方面,戴爾智能數(shù)據(jù)平臺整合了全流程數(shù)據(jù)管理。通過咨詢服務(wù)梳理數(shù)據(jù)智能和商業(yè)智能的用例需求,依托數(shù)據(jù)湖倉實現(xiàn)跨云、跨數(shù)據(jù)源的統(tǒng)一查詢與治理,結(jié)合Elastic Search的元數(shù)據(jù)索引和PowerScale Metadata IQ完成非結(jié)構(gòu)化數(shù)據(jù)準(zhǔn)備工作,并通過元數(shù)據(jù)增強引擎生成可消費數(shù)據(jù)產(chǎn)品。其多協(xié)議存儲支持高性能訪問,消除了數(shù)據(jù)在不同協(xié)議間的數(shù)據(jù)搬運開銷。此外,網(wǎng)絡(luò)安全套件提供了威脅防護(hù)與實時響應(yīng),輔以生命周期服務(wù)和優(yōu)化分析引擎,形成了從數(shù)據(jù)整合、存儲、分析到安全防護(hù)的完整解決方案。
![]()
總的來看,采用PowerScale或ObjectScale作為存力底座的戴爾智能數(shù)據(jù)平臺以“開放架構(gòu)兼容生態(tài)、就地查詢激活全量數(shù)據(jù)、自研技術(shù)保障性能、立體安全守護(hù)資產(chǎn)”為核心,構(gòu)建了適應(yīng)智能時代的數(shù)據(jù)基礎(chǔ)設(shè)施,其關(guān)鍵價值不僅在于解決數(shù)據(jù)孤島與遷移難題,更通過技術(shù)開放性與安全可靠性,幫助企業(yè)構(gòu)建敏捷、可持續(xù)的數(shù)據(jù)生態(tài),從容應(yīng)對數(shù)據(jù)智能驅(qū)動的業(yè)務(wù)創(chuàng)新挑戰(zhàn),加速企業(yè)搶占智能創(chuàng)新的制高點。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.