編輯|冷貓
人類有一種執念,就是將我們引以為傲的文明數據永遠的保留下去。從旅行者一號的金唱片開始,這一切都被附上了一層浪漫色彩。
![]()
這張金唱片以聲音和圖像的形式描繪地球生命。在發射時,制作人薩根博士表示:「只有在星際空間中存在先進的太空文明時,太空船才會被發現,唱片才會播放,但將這個瓶子發射到宇宙海洋中,表明了這個星球上的生命非常有希望。」
在旅行者探測器離開地球的那一刻起,就意味著這張記載人類文明信息的唱片將在宇宙中無盡地漂流,遇到另一個行星系統還有 40000 年的時間。而這張唱片的設計保存時長有十億年。
眾所周知,磁盤硬盤為主的數字存儲介質雖然能夠保存海量的數據,但是壽命和穩定性卻不盡如人意。而用傳統的模擬信號,幾乎等同于將信息雕刻在物理介質上,搭載的信息又極其受限。就像這張金唱片,只能搭載少量的音頻和圖像信息。
有沒有一種辦法,能夠用物理介質搭載模擬信息的辦法,來保存更多的數字信息呢?
微軟主導的研究項目 Project Silica 給出了一個非常出色的答案。他們將目光投向了一個全新的存儲介質:玻璃。

將數據存儲在玻璃上聽起來很未來,很浪漫。但其實這個概念可以追溯到 19 世紀,將攝影負片保存在玻璃板上的技術。不過,在光學技術極其發達的今天,一塊玻璃板已經能夠存儲令人驚訝的數據量。
根據微軟研究團隊的信息,Project Silica 已經實現了在一塊120 毫米見方、2 毫米厚的玻璃中存儲了301 層的數據數據密度為1.59 Gbit?mm?3容量達到了驚人的 4.8 TB
寫入模式實現了每束光 25.6 Mbit?s?1 的寫入吞吐量,受激光重復頻率限制,能量效率為每比特 10.1 nJ。 此外,研究團隊將存儲能力擴展到硼硅酸鹽玻璃,提供了一種成本更低的中介材料,并降低了寫入和讀取的復雜性。
對硼硅酸鹽中寫入的體素進行的加速老化測試表明,數據壽命超過 10,000 年
Project Silica 是第一種滿足生產存儲系統所有要求的基于玻璃的數據存儲技術。該研究已經在 Nature 發布。
![]()
- 論文標題:Laser writing in glass for dense, fast and efficient archival data storage
- 論文地址:https://www.nature.com/articles/s41586-025-10042-w
玻璃是三維的
為什么玻璃能夠作為數據存儲介質?
首先,現代光學技術已經能夠實現十分精細的能量控制,同時玻璃具有熱穩定性和化學穩定性,能夠抵抗濕氣侵入、溫度波動和電磁干擾。并且,其熔融特性能夠實現局部光學性質的改變。
和傳統物理介質最大的不同在于,玻璃是三維的
相比于我們最熟悉的物理介質存儲的最原始形態,也就是石碑,只能在一個表面雕刻信息,玻璃能夠實現多層的數據存儲,將三維空間中的體積全都利用起來。
由像素向體素的飛躍,在數據存儲領域是質的變化。
![]()
系統架構示意圖: a, 數據由用戶接收。這些數據被準備為比特流,例如,使用壓縮、加密和 FEC。b, 比特被編碼為符號。一個符號對應于調制器配置。c,d, 玻璃樣品被加載到寫入子系統中,隨著激光束相對于玻璃移動,調制器設置隨時間變化。符號逐層寫入,從下往上,填充玻璃的整個厚度。e, 數據可以安全地存儲在玻璃中超過 10,000 年。f, 為了讀取,我們使用帶有相機的自動化顯微鏡來捕獲每個體素二維層的圖像。g, 圖像被傳遞到解碼器以恢復用戶數據。
過去,玻璃存儲依賴的是雙折射體素(birefringent voxel)通過超短激光改變熔融石英內部的偏振結構,把信息編碼進材料。問題在于,形成一個體素往往需要多次脈沖疊加,工藝復雜,效率受限。
微軟團隊首先在飛秒激光寫入系統上動刀:研究者把形成體素所需的脈沖數壓縮到兩次,并證明第一次脈沖的偏振方向并不會決定最終體素的偏振結果。這個看似細節的發現,其實釋放了巨大的工程空間。
在此基礎上,他們進一步提出「偽單脈沖寫入」—— 將一個已經設定好偏振的激光脈沖分裂成兩束,使其同時充當一個體素的關鍵脈沖和另一個體素的輔助脈沖。配合光束掃描系統,寫入過程從精細雕刻式的點狀加工,演化為可以高速連續推進的工業級流程。玻璃存儲第一次在寫入效率上顯露出規模化潛力。
這一方法運用于高純石英玻璃,對材料的要求更高,成本更高。
![]()
一種用于將數據高速寫入玻璃的科研級寫入設備,創下了記錄。
但更具突破性的,是他們提出了一種全新的存儲形態:相位體素(phase voxel)
與依賴偏振變化的雙折射體素不同,相位體素通過改變玻璃內部的相位結構來編碼信息,而且只需單個激光脈沖即可形成。這不僅進一步簡化了寫入流程,還拓寬了材料邊界。研究團隊證明,相位體素不僅能在熔融石英中生成,也能在更常見的硼硅酸鹽玻璃中實現。
同時,他們設計了新的光學讀取方案,用以解析嵌入材料內部的相位信息。需要指出的是,相位體素在三維空間中會產生更強的符號間干擾,這是高密度三維存儲不可避免的副作用。為此,研究者引入機器學習分類模型,對讀出信號進行判別和糾錯,把原本的物理串擾問題轉化為可被算法消化的信號處理問題。材料科學與人工智能在這里真正發生了耦合。
![]()
一種用于從玻璃中讀取數據的科研級讀取設備。
當寫入機制與存儲形態得到革新之后,論文將重點轉向規模化能力。玻璃內部在激光作用下會經歷復雜的預熱與后熱過程,這種熱場相互影響長期限制了體素的鄰近寫入。
研究團隊構建了相應的數學模型,并在此基礎上發明多光束傳輸系統,使多個數據體素能夠在空間上相鄰、時間上同步地寫入,從而顯著提升整體吞吐速度。更有意思的是,他們利用體素形成時產生的光發射現象,作為寫入過程的實時反饋信號,實現靜態校準與動態控制。這意味著系統不再只是「盲寫」,而是具備自我監測與自動調節能力,向真正的自動化寫入系統邁進。
利用雙折射體素,在石英玻璃中,研究團隊實現了 1.59 Gbit?mm?3 的數據密度(每片盤的可用容量為 4.84 TB,體素間距為 0.500 μm × 0.485 μm,層間距為 6 μm,301 層,8 個方位級別,0.85 品質因數),寫入吞吐量為 25.6 Mbit?s?1,寫入效率為每比特 10.1 nJ。
利用相位體素,在硼硅酸鹽玻璃中,研究團隊實現了 0.678 Gbit?mm?3 的數據密度(可用容量每盤 2.02 TB,體素間距 0.5 μm × 0.7 μm,層間距 7 μm,258 層,4 個能量級別,0.92 品質因子),寫入吞吐量為 18.4 Mbit?s?1 ,寫入效率為每比特 8.85 nJ。此外,多束系統通過四束并行寫入實現了 65.9 Mbit?s?1 的吞吐量,且不會引起熱損傷。
![]()
寫入設備特寫,展示激光脈沖的高速多束數據編碼。
最后,我們把視角拉回數字存儲系統本身。
研究者提出了一種基于機器學習的符號編碼優化方法,用以系統性地權衡錯誤率、錯誤保護強度與恢復能力之間的關系。更關鍵的是,他們開發了一種新的非破壞性光學檢測手段,用于識別玻璃內部體素的老化狀態,并結合加速老化實驗,給出了支持數據保存 10,000 年的實證依據。
封存在玻璃中的文明
「僅五千年前,我們才開始使用文字。如果你思考一下將數據存儲一萬年的意義,那簡直是一個極其漫長的時間。」微軟杰出工程師 Ant Rowstron 如此評價團隊的工作。
在保存人類文明這樣浪漫的事上,研究團隊已經開始了他們的嘗試。微軟 Project Silica 團隊與一家創業公司合作,將這項技術應用于他們在挪威斯瓦爾巴群島的全球音樂寶庫。
![]()
他們使用基于二氧化硅的玻璃板,創建一個耐用的檔案庫,不僅能夠抵抗電磁脈沖和極端溫度,而且相當環保。這個寶庫將補充像全球種子寶庫和北極世界檔案館這樣的存儲設施,為音樂遺產提供一個全面的庇護所 —— 從古典歌劇到現代熱門歌曲和原住民作品。
Project Silica 的目標,是把數據寫入一塊玻璃,然后像檔案一樣放在架子上,直到真正需要時再取出讀取。一旦寫入完成,玻璃內部的數據將無法被篡改
玻璃存儲技術最突出的特點之一,是極高的空間效率。如今的數據中心往往是龐大的基礎設施集群,而玻璃存儲所需的物理空間卻只是其中的一小部分。Richard Black 表示:「我們在 Project Silica 開發的技術,可以在極其緊湊的形態中存儲海量數據。這是一種全新的效率與可持續性范式。」相比需要持續供電、冷卻和維護的大型存儲陣列,玻璃板更像是高密度、低運維成本的長期檔案介質。
目前,玻璃存儲技術已經能夠在一塊玻璃板上存儲數 TB 數據,并實現長達 10,000 年的保存時間。這在超長期存儲介質中是難以想象的。
或許,用一個玻璃數據庫來封裝人類文明的全部精華,已經不是遙不可及的夢想。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.