![]()
摘要
隨著量子比特規模不斷增長,傳統計算手段正逐漸難以應對復雜量子系統的指數級挑戰。人工智能正在為量子物理打開一扇全新的“理解之門”。本篇文章由論文共同作者、上海交通大學 John Hopcroft 計算機科學中心長聘教軌副教授吳亞東撰寫,帶你快速了解 AI 如何學習量子系統,以及這一新交叉領域正在催生的前沿進展。
關鍵詞:量子計算、人工智能、量子模擬、機器學習、深度學習、神經量子態、大語言模型、量子基態預測
吳亞東丨作者
趙思怡丨審校
![]()
論文題目:Artificial intelligence for representing and characterizing quantum systems 論文鏈接:https://arxiv.org/pdf/2509.04923 發表時間:2025年9月5日 論文來源:arxiv
近年來,量子計算和量子模擬技術迅速發展,我們已經能夠制備和操縱越來越復雜的量子設備。然而,隨著量子比特數量不斷增加,其對應的量子態空間維度——即 Hilbert 空間維度——呈指數級增長:僅 50 個量子比特的系統,其可能態數量就已經超過傳統超級計算機能高效處理的范圍。在這一背景下,如何描述、預測和理解復雜量子系統成為一項核心挑戰。
與此同時,人工智能(AI)的快速演進為量子科學帶來了新工具。AI 正逐漸成為理解復雜量子系統結構、性質與動力學的重要助力。
量子系統的“大數據困境”
一個由上百個量子比特組成的系統,其可訪問態數量可能遠超宇宙中的原子總數。傳統數值方法(如張量網絡)雖然在低糾纏系統表現優異,但面對高度糾纏態時計算成本急劇飆升,就像試圖用一張二維地圖去描述真正的多維地形一樣力不從心。
這使得研究者開始尋找新的思路,而 AI 正是在此背景下進入量子物理的舞臺。
AI 介入量子科學的三大范式:
ML、DL 和 LM
為了應對這一挑戰,研究者們將人工智能技術引入量子科學領域,并主要發展了三種學習范式:
![]()
圖1:利用人工智能表征和刻畫量子系統的關鍵任務與應用概覽。對由量子模擬器生成的基態以及數字量子計算機制備的量子態進行表示與特性刻畫,可歸納為三類主要任務:線性性質預測、非線性性質預測以及量子態與量子過程的重建。每一類任務又可進一步細分為不同子類,以對應更具體的研究目標。底部的圖標表示通常用于各類任務的 AI 學習范式——機器學習(ML)、深度學習(DL)和語言模型(LM)。這些方法當前及潛在的應用場景包括:量子算法優化、量子器件的認證與基準測試、量子硬件開發,以及科學發現。
1.機器學習(ML):高可解釋性的物理預測工具
傳統機器學習模型,特別是基于核方法或線性回歸的模型,在預測量子系統的線性性質方面表現出色。例如,我們可以訓練一個模型,僅通過少量測量數據,就能預測一個量子基態的磁化強度或能量。
這類方法的優勢在于其可解釋性和理論保證。研究者可以嚴格證明,在滿足某些條件(如系統的局部性、能隙等)時,這類模型能以多項式樣本復雜度實現高精度預測。例如,Huang等人提出的基于“經典影子”的核方法,已在實驗中被用于預測多達50個量子比特的Rydberg原子系統的性質。
2.深度學習(DL):從數據中自動提取量子結構
深度學習通過深層神經網絡自動從數據中提取特征,不僅能夠預測線性性質,還能處理非線性性質,如量子糾纏熵、態保真度等。同時,深度學習在量子態重建方面展現出巨大潛力。通過生成式學習。 “神經量子態”模型可以逼近目標量子態的測量統計分布。訓練完成后的這個神經網絡就可以作為一個“經典替身”,在無需真實量子設備的情況下,生成與真實量子態一致的測量結果。
3.語言模型(LM):邁向“量子基礎模型”
受GPT等大語言模型的啟發,研究者開始將Transformer架構引入量子系統學習。這類模型通常采用預訓練-微調的兩階段策略:
預訓練階段:模型在大規模未標記的量子數據上學習,捕捉量子態的通用結構和模式。
微調階段:模型在特定任務的標注數據上進一步調整,用于預測能譜、關聯函數等具體性質。
這種方法的優勢在于其通用性和可遷移性。一個預訓練好的“量子基礎模型”可以被快速適配到多種不同的任務中,大大降低了對新任務的訓練成本。
AI 如何一步步學習量子系統?
AI學習量子系統是一個系統性的過程,其核心流程可以清晰地分為三個步驟:
![]()
圖2:面向大規模量子系統學習的 AI 模型概覽。該層級結構展示了 AI 模型在處理大規模量子系統時能力的遞進:從廣義的人工智能,到機器學習模型、深度學習模型,再到基于 Transformer 的模型,其適應性與表達能力依次增強。各類別中具有代表性的策略以綠色圓點標示。文中的符號 “NN”、“NQS” 與 “LLM” 分別代表 神經網絡(Neural Networks)、神經量子態(Neural Quantum States) 和 大型語言模型(Large Language Models)。其中,“序列模型”包括遞歸神經網絡(RNN)、長短時記憶網絡(LSTM)以及相關架構。
第一步:數據收集
科學家們首先需要準備一個由許多不同量子狀態組成的“訓練集”。對于一個由參數(如磁場強度、電路旋轉角度)控制的量子系統,他們會選取參數的多種組合,制備出對應的量子態。接著,他們使用一種量子測量方案(任何量子測量都可被稱為POVM),對每個制備好的量子態進行多次測量,收集到的測量結果(通常是一串串0和1的比特序列)就構成了原始的“量子數據”。
第二步:模型訓練
收集到的原始數據會被處理成AI模型能用的格式。根據任務目標的不同,訓練方式也分為兩種:
性質預測(判別式學習):如果目標是預測某個物理量(如能量),那么數據會被處理成 {物理參數, 對應的測量結果, 目標物理量} 的標簽化數據集。AI模型(如一個深度神經網絡)通過不斷調整自身參數,學習從“輸入”到“目標”的復雜映射關系,直到其預測值盡可能接近真實值。
狀態重建(生成式學習):如果目標是讓AI學會“模仿”某個量子態,那么訓練數據就只是大量的、無標簽的測量結果。模型(如神經量子態,NQS)的目標是學習其背后的概率分布。訓練成功后,這個AI模型本身就成為了該量子態的一個“經典替身”,能夠生成與真實量子測量統計特性相同的樣本。
第三步:模型預測
訓練好的模型就可以投入實際應用了。對于一個全新的、未知的量子系統,我們可以:
如果是測量無關型模型,只需輸入其經典描述參數,模型就能直接輸出預測的物理性質,無需對真實量子設備進行任何測量。
如果是測量依賴型模型,則需要先對真實量子系統進行少量測量,然后將測量結果輸入模型,模型會結合這些新數據給出更準確的預測。
AI 在量子科學中的典型應用
![]()
圖3:量子系統學習協議的整體框架。目前用于表示和刻畫可擴展量子系統的學習模型一般包含三個階段:數據收集、模型構建與優化、模型預測。左側面板展示了數據收集階段,其中量子系統在參數x(i)和輔助信息z(i)的控制下被制備為量子態ρ(x(i))。隨后,對該量子態進行T次測量以獲得測量結果s(i)。中間面板展示了數據集構建與模型實現階段。當原始數據集T收集完畢后,需要根據具體任務對其進行預處理,生成對應的任務數據集TML、TDL和TLM,分別用于訓練基于 ML、DL 和 LM 的模型。右側面板展示模型預測階段。根據預測是否需要額外的量子測量數據作為輸入,學習協議可分為基于測量的學習(measurement-based)和獨立于測量的學習(measurement-agnostic)兩類。
精準預測新量子基態性質:通過訓練ML模型學習已知量子基態的參數與性質關系,AI能夠快速預測新的基態磁性和相關函數,有望大幅加速新材料的理論篩選與設計流程。
為量子計算機“體檢”:利用深度學習模型分析量子計算機的局部測量結果,AI可以高效地估計制備出的量子態與理想態的保真度,為量子硬件的性能驗證與校準提供關鍵工具。
充當量子算法的“速算教練”:在變分量子算法優化過程中,AI可以學習參數與能量之間的映射關系,構建快速計算的經典代理模型,或直接預測更優的參數更新方向,顯著減少在真實量子設備上的耗時評估。
自動繪制量子相圖:基于來自模擬或實驗的量子態數據,采用無監督學習,AI能夠自動識別出量子系統在參數空間中的不同物相,并定位相變臨界點,輔助物理學家探索復雜的量子相行為。
前沿挑戰與未來趨勢
盡管 AI 在量子系統表征方面已取得顯著進展,但仍面臨諸多挑戰:
理論保障不足:目前深度學習模型仍缺乏嚴格的理論保證。
數據稀缺:高質量量子數據的獲取成本高,限制了模型的泛化能力。
可解釋性差:AI 模型的“黑箱”特性使其決策過程難以理解。
未來,隨著更多開源數據集和標準化評測平臺的建立,AI 與量子科學的結合將更加緊密。我們有望看到能夠處理多種量子數據、適應不同任務的“量子基礎模型”出現,進一步推動量子技術的發展。
結語
人工智能正在成為理解和控制復雜量子系統的強大工具。它不僅幫助我們解決了傳統方法難以應對的問題,還為我們打開了探索量子世界的新窗口。盡管面臨可解釋性、數據依賴和泛化能力等挑戰,但這些挑戰正驅動著研究向更深入的方向發展。隨著 AI 與量子科學的深度融合,我們離實現真正的大規模量子計算和量子模擬又近了一步。
本文轉載自《集智俱樂部》微信公眾號
《物理》50年精選文章
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.