摘要
近年來,機載LiDAR點云數據的應用日益廣泛,其語義分割是實現三維場景理解的重要環節,但現有部分分割方法存在一定的缺陷。
本文提出了一種融合投影注意力和高程注意力機制的點云分割網絡(Projection Attention and Elevation Attention Network, PE-Net)。首先,為實現高效的全局依賴建模,投影注意力模塊將傳統自注意力中的鍵和值投影至一個低秩子空間,從而以線性計算復雜度捕捉長距離關系。其次,為充分利用機載數據的垂直結構先驗知識,高程注意力模塊直接從點的Z坐標學習注意力權重,顯式地增強了模型對地形變化的敏感度。最后,局部-全局特征增強模塊通過并行的最大池化與平均池化操作聚合了多尺度上下文信息,實現了局部幾何細節與全局語義的深度融合,有效提升了對復雜空間結構的表達能力。
利用ISPRS Vaihingen3D 和GML等主流機載LiDAR點云數據集對本文方法進行了驗證,實驗結果表明:PE-Net在ISPRS Vaihingen3D數據集上取得了82.6%的OA分數和72.1%的Avg.F1分數,在GML數據集上則達到97.0%的OA分數和72.8%的Avg.F1分數;同時,在LASDU數據集上也展現出較優的分割結果。與基線方法KPConv相比, PE-Net在GML數據集上的OA分數和Avg.F1分數上分別提升了7.0%和20.4%。
相較于現有主流方法,本文提出的PE-Net在總體精度和Avg.F1分數上均取得了顯著提升,證明了PE-Net在復雜三維場景點云語義分割任務中的有效性和魯棒性。
![]()
引用
李龍威, 劉曉棟, 陳輝, 楊禮平, 趙立科, 張卡. 基于投影注意力和高程注意力的機載LiDAR點云語義分割[J]. 地球信息科學學報, 2025, 27(11): 2684-2700
引言
![]()
本文提出了一種融合投影注意力與高程注意力機制的機載LiDAR點云語義分割網絡PE-Net(Projection Attention and Elevation Attention Network)。該網絡通過對傳統自注意力中的鍵和值進行投影,得到一個投影后的注意力矩陣,以較低的計算代價建模全局長距離依賴,同時通過高程注意模塊顯式提升對地形變化的感知能力。此外,該網絡設計了一個局部-全局特征增強模塊,通過對全局和局部特征進行融合,以實現更加細致的空間結構建模。
![]()
![]()
主要圖表
![]()
圖1 PE-Net網絡結構示意
![]()
圖2 投影注意力結構示意
![]()
圖3 局部-全局特征增強模塊結構示意
表1 ISPRS Vaihingen3D數據集類別分布
![]()
![]()
圖4 ISPRS Vaihingen3D數據集可視化結果
![]()
圖5 ISPRS Vaihingen3D測試集分類結果混淆矩陣及誤差圖
![]()
圖6 ISPRS Vaihingen3D測試集分類結果可視化
![]()
圖7 GML測試集分類結果混淆矩陣及誤差圖
![]()
圖8 GML測試集分類結果可視化
![]()
圖9 LASDU測試集分類結果混淆矩陣及誤差圖
![]()
圖10 LASDU測試集分類結果可視化
![]()
圖11 高程注意力分數渲染圖
結束語
本文針對ALS點云語義分割中全局建模不足和高程信息利用不充分的問題,提出了一種融合投影注意力與高程注意力機制的新型深度學習點云語義分割網絡PE-Net。主要結論如下:
(1)為解決全局建模計算成本高昂的問題,本文設計的投影注意力模塊在大幅降低計算復雜度的同時有效捕捉了長距離空間依賴。為強化對地形特征的感知,高程注意力模塊顯式地利用了點云的垂直結構信息。最后,通過局部-全局特征增強模塊實現了多尺度特征的高效融合,顯著提升了模型對復雜三維場景的綜合表達能力。
(2)本文在ISPRS Vaihingen3D、GML和LASDU數據集上進行了實驗驗證。與KPConv基準模型相比,PE-Net在3個數據集上的Avg.F1分數分別提升了3.7%、20.4%和2.7%,驗證了其在ALS點云語義分割任務中的有效性和魯棒性。本研究為大規模點云的高效全局建模提供了新的思路,對推動高精度三維地理空間智能應用具有重要意義。
![]()
盡管PE-Net在ISPRS Vaihingen3D等3個公開點云數據集上取得了較好的語義分割結果,但其特征融合模塊采用的固定池化策略在聚合全局上下文時缺乏動態適應性,從實驗結果上看,在“低矮植被”這一幾何形態更復雜、紋理更不規則的自然地物類別上,本方法的性能在ISPRS Vaihingen3D和LASDU數據集上相較于VD-LAB等方法存在一定差距。而這可能是因為固定的池化策略在處理這類紋理豐富但宏觀結構不明顯的類別時,難以自適應地捕捉到最關鍵的區分性特征。
未來的工作將探索引入可學習的自適應聚合策略來替代或補充固定的池化操作,以增強模型對不同類別特征的動態感知能力。另外,進一步優化模型輕量化設計,將其拓展至更多樣化的點云數據,并探索與多模-態數據的融合策略,以期在更廣泛的地理空間智能應用中發揮更大作用。
來源:測繪學術資訊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.