實時、高維度、大范圍的水質數據對于理解復雜的水生態系統動態至關重要。然而,作為水環境分析“金標準”的激發發射矩陣熒光光譜法,卻因其設備龐大、成本高昂和操作復雜,難以滿足原位、高通量的現場監測需求。傳統的EEM技術依賴氣體放電燈和單色器,雖然精度高,但在設備小型化與成本控制上遇到了瓶頸。如何在保證光譜 fidelity 的前提下,實現設備的小型化和低成本,成為了該領域亟待解決的難題。
鑒于此,中國科學技術大學俞漢青院士與錢晨教授揭示了高分辨率EEM光譜固有的冗余性和自相關性,并表明寬帶激發在降低采樣率的情況下比傳統的窄帶方法更能有效地保留關鍵光譜信息。他們進一步證明EEM數據位于低維流形上,這使得他們可以利用算法從寬帶發光二極管(LED)激發中重建高分辨率光譜。基于這些發現,他們推出了Minifluor,一種定制的便攜式EEM傳感器,并結合了深度生成解碼模型D4DM。與臺式儀器的廣泛驗證以及在城市河流中進行的自主水面航行器測量,證實了該方法在實時水生環境監測方面的準確性和魯棒性。通過整合理論理解、硬件創新和算法重構,這項工作建立了一個可擴展的環境傳感和水質管理流程。相關研究成果以題為“A miniaturized low-cost excitation–emission matrix sensor for aquatic environmental monitoring with preserved spectral fidelity”發表在最新一期《nature sensors》上。
![]()
![]()
寬帶激發在稀疏采樣中的信息優勢
研究首先通過對68個高分辨率EEM樣品分析,證實了EEM數據的高度冗余性(例如,25倍壓縮不會造成明顯的光譜失真,意味著超過96%的信息是冗余的)。為了模擬不同采樣策略的效果,作者采用了線性采樣模型(圖1a),并計算了二維信息熵。結果表明,當采樣率降低時,寬帶激發(如LED)產生的EEM能夠保留更豐富的結構信息。例如,在使用15個LED、平均激發步長達到24納米(相當于窄帶1/8采樣率)時,其二維熵(0.40 bits)是同等稀疏采樣下窄帶激發(0.17 bits)的兩倍,甚至接近7/8采樣率的窄帶光譜(圖1e)。
![]()
圖 1. EEM 頻譜采集中窄帶與寬帶采樣的比較
驗證流形假說與重建可行性
進一步的感知哈希(pHash)分析也證實,在稀疏采樣條件下,寬帶LED-EEM的哈希特征比窄帶EEM更接近原始高分辨率EEM(圖2a, 2b)。基于上述發現,作者提出流形假說,即EEM數據位于一個低維流形上。通過自編碼器將高分辨率EEM(HR-EEM)、LED-EEM和稀疏窄帶EEM映射到低維潛空間后發現,LED-EEM與HR-EEM的流形結構高度相似,而稀疏窄帶EEM則位于一個截然不同的流形上(圖2e)。隨后,通過擬合一個簡單的線性變換,成功地將LED-EEM的潛在特征映射到了HR-EEM的潛在空間,而窄帶EEM則無法實現這一映射(圖2f)。這強有力地證明了從稀疏寬帶激發的LED-EEM中重建出高分辨率EEM在理論上是完全可行的。
![]()
圖 2. 通過表示學習和線性變換橋接 LED 采樣和 HR-EEM 頻譜
Miniflour硬件與D4DM解碼模型的構建
基于上述理論驗證,團隊研制了Miniflour原型機。它用15個覆蓋250-600 nm波長的寬帶LED陣列替代了傳統的大型光源和單色器,配合微型光譜儀,實現了設備的便攜化、低成本和可編程(圖3b, 3c, 3d)。為解決LED寬帶激發帶來的光譜畸變和分辨率降低問題,作者開發了D4DM深度生成解碼網絡。通過對比線性模型、編碼器-解碼器和U-Net三種架構,發現結合了非線性卷積與線性跳躍連接的U-Net模型在峰值信噪比(PSNR)、結構相似性(SSIM)和視覺信息保真度(VIF)等圖像質量評估指標上均表現最優,分別達到32.86、0.96和0.81(圖3f)。
![]()
圖 3. Minifluor 的原理圖設計及優勢,以及 D4DM 模型選擇
D4DM模型的性能驗證與應用評估
研究通過多種方式對D4DM的重建性能進行了嚴格驗證。首先,在包含污水處理廠實際水樣的測試集中,重建光譜與實測光譜的熒光商(FQ)分布無明顯系統性偏差,相似度指標(皮爾遜相關系數、余弦相似度等)普遍在0.98以上,證實了重建的高保真度。其次,線性疊加實驗驗證了D4DM模型遵循熒光的線性疊加原理,加權和的重建結果與重建結果的加權和高度一致(相似度>0.96,圖4a, 4b)。更重要的是,平行因子分析(PARAFAC)表明,從D4DM重建的EEM數據中分解出的組分與從實測數據中分解出的組分高度吻合,組分得分的皮爾遜相關系數超過0.97(圖4c-4f),這證實了重建數據在化學計量學分析中的可靠性。此外,Miniflour-D4DM系統對常見干擾因素(溫度、pH、濁度)表現出良好的魯棒性,并達到了1.82 μg/L的硫酸奎寧檢測限和7.3 nm的最小可分辨激發波長差。
![]()
圖 4. 利用線性分析和并行因子分析對訓練后的 D4DM 進行評估
實地應用:揭示城市河流的精細水質變化
為展示其實地應用能力,團隊將Miniflour集成到無人船上,在合肥南淝河一段8.3公里的河道進行了2.2小時的連續走航監測,獲取了132個點位的高密度EEM數據(空間分辨率<63米)。相比之下,傳統人工采樣僅獲取了10個點位的數據。通過PARAFAC分析,成功識別出類微生物腐殖質(C1)、類蛋白質(C2)和類陸源腐殖質(C3)三種熒光組分(圖5d)。基于這132個高密度數據點的相關性和因果分析,揭示了僅憑10個人工采樣點無法發現的、在支流匯入處水質參數的突變(圖5e)。進一步運用因果發現工具,構建了13個環境變量間的有向無環圖(圖5g),并識別出pH與C2關系中的辛普森悖論,即當忽略混雜因素C3(陸源腐殖質)時,兩者關系會被誤導。通過以C3為條件進行分層分析,揭示了pH與C2相關性在空間上的顯著變化,為理解城市河流生物地球化學過程提供了新的洞見。
![]()
圖 5. 位于 ASV 上的 Minifluor,用于沿城市河流連續收集 EEM 光譜和多重水質變量的數據
總結與展望
本研究深刻揭示了高分辨率EEM光譜的數據特性,并巧妙利用其低維流形結構,通過硬件創新(Miniflour寬帶LED激發)與算法突破(D4DM深度解碼)相結合的方式,成功實現了低成本、便攜化、高保真的EEM熒光傳感。該系統不僅能準確量化水環境中多樣的熒光團,其獲取的高密度數據更使得應用先進的統計和因果分析工具成為可能,為實時環境監測、精細水質評估和數據驅動的管理決策提供了強大支持。盡管目前對于訓練數據中罕見的、具有精細激發結構的熒光物質重建效果有限,但隨著光譜庫的擴充和模型的迭代,Miniflour-D4DM框架有望發展為一種可大規模部署的實時熒光傳感解決方案,推動全球和區域尺度的水環境管理邁入數據驅動的新階段。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.