長讀長測序技術已在全基因組層面實現了對人類結構變異的深度解析,同時提升了對嵌合結構變異的識別能力。隨著單倍型分型技術的不斷發展,結構變異檢測迎來了全新技術路徑——無需依賴全基因組從頭組裝,便可直接獲得單倍型分辨率水平的變異信息。然而,當前主流方法在單體型信息的挖掘與利用上仍存在明顯不足,難以精準區分多等位基因及嵌合結構變異;同時,在多種測序平臺間的普適性依然受限。這些瓶頸正成為阻礙高效、精準單倍型感知結構變異分析的關鍵挑戰。
近日,哈爾濱工業大學王亞東、姜濤團隊在Advanced Science期刊發表題為cuteHap: Haplotype-Aware Structural Variant Detection in Phased Long-Read Sequencing Data的研究論文提出了一種面向分型長讀長測序數據的單倍型感知結構變異檢測新方法cuteHap(圖1)。
![]()
該方法創新性 提出了基于分型質量的基因組區域評分量化方法,將基因組劃分為高質量區與低質量區,并根據區域質量決定后續等位基因聚類與識別過程對分型信息的依賴程度。針對不同區域采用差異化的等位基因識別策略:在分型高質量區域,進行單倍型特異的自適應聚類與等位基因整合;在分型低質量區域,采用基于聚類可信度優先的集束搜索,結合改進的貝葉斯估計框架推斷基因型。兩種策略有效地利用了單倍體分型信息,獲得精準的且具有單倍型分辨率的結構變異集合。同時,該方法根據測序片段的單倍型溯源分布實現低等位基因嵌合變異檢測,為遺傳學、臨床醫學研究提供了有效方法。
![]()
圖1 cuteHap方法的示意圖
研究團隊基于HG002、NA12878等多個國際人類金標準數據集開展系統測試。在最新HG002 T2T金標準下,cuteHap在PacBio HiFi與ONT測序平臺均達到最高F1分數(分別為94.66%、93.75%)。在單個等位基因嚴格比對中,cuteHap優勢進一步凸顯,較次優方法分別提升6%和3%。在模擬數據集、復雜醫學相關基因挑戰集、白金家系樣本上,cuteHap均持續保持最優F1表現。同時,該方法還能夠精準解析雜合變異連鎖關系、識別多態性等位基因,充分驗證了其優異的單倍型感知變異檢測性能。
為了深入探究分型工具、測序深度等關鍵因素對cuteHap性能的影響,研究團隊進行了系統性評估。在分型工具選擇上,無論采用LongPhase還是WhatsHap,cuteHap在真實數據中F1分數波動均不超過0.5%,展現出優異的穩定性與工具兼容性。在測序深度方面,cuteHap在20×深度下性能保持穩定,且優于其他同類工具;當深度降至5×時,ONT數據的性能出現明顯下降。進一步溯源分析表明,低深度下SNP檢測與分型準確性顯著受限,進而制約了cuteHap的性能。因此,與相關研究結論一致,推薦使用不低于10×的測序數據開展變異檢測。
人類基因組中,除胚系結構變異外,細胞在受精后還會產生DNA序列改變,即體細胞嵌合變異。這類變異僅存在于部分細胞中,等位基因頻率低、檢測難度大。cuteHap 專門設計了嵌合變異檢測模塊,通過等位基因識別與單倍型追溯,將僅來自同一單倍體、且不滿足雜合胚系結構變異特征的低頻變異,判定為嵌合變異。模擬與混樣實驗證實,cuteHap 可識別更多準確的嵌合結構變異。
體細胞嵌合變異中,腫瘤相關變異是重要研究方向。研究團隊以HG008(胰腺癌樣本)、COLO829(黑色素瘤樣本)兩個真實腫瘤樣本為對象,人工構建腫瘤相關低頻變異基準集。在不同測序平臺數據中,cuteHap檢出的低頻結構變異數量更多、類型更全(缺失、插入、倒位、易位均覆蓋),可為體細胞低頻結構變異解析與臨床研究提供可靠方法支撐。
研究團隊長期深耕基因組解析算法研究,建立了cute系列結構變異檢測算法“全家桶”(表1)。2020年8月發表了cute系列首個結構變異檢測算法cuteSV,該算法已經成為當前國際上最為廣泛使用的結構變異檢測算法工具之一。2025年6月和12月再次相繼發表了結構變異基因型重分型算法cuteFC、結構變異實時檢測算法cuteSV-OL。cuteHap是繼cuteSV、cuteFC、cuteSV-OL之后又一方法力作,實現了高性能、單倍型分辨率的結構變異檢測。通過單倍型特異的自適應聚類與基于聚類可信度優先的集束搜索兩大策略,充分挖掘并利用分型信息。與當前主流先進方法相比,cuteHap在準確性、魯棒性、高效性上均表現更優,是高質量單倍型感知結構變異檢測的有力工具,有望為基因組學前沿研究與精準醫學提供重要支撐。
表1 cute系列結構變異檢測算法“全家桶”
![]()
制版人:十一
論文鏈接:https://doi.org/10.1002/advs.202519314.
相關代碼與數據:
https://github.com/Meltpinkg/cuteHap
BioArt
Med
Plants
人才招聘
學術合作組織
(*排名不分先后)
![]()
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.