近日,中國農業大學張毅教授團隊在《Briefings in Bioinformatics》期刊上發表題為“GWKBR: a novel method integrating machine learning and Bayesian inference framework to improve genomic prediction accuracy”的研究成果。中國農業大學動物科學技術學院張毅教授為論文通訊作者,博士生王雪為論文的第一作者。
該研究針對傳統基因組預測方法難以同時兼顧非加性遺傳效應捕捉和SNP差異化加權利用的問題,提出了一種整合機器學習與貝葉斯推斷框架的基因組預測方法——GWAS加權高斯核貝葉斯回歸(GWKBR),為動植物復雜性狀的基因組預測提供了新的方法學工具。
基因組選擇是現代動植物育種中的關鍵技術,統計模型的選擇直接影響基因組預測的準確性。傳統的基因組預測方法往往忽略了非加性效應和SNP權重的異質性。因此,研究團隊提出GWKBR方法,該方法引入了一種新的協方差結構先驗分布,并整合了機器學習技術(加權高斯核回歸和貝葉斯優化)、貝葉斯推斷、限制性最大似然法(REML)、全基因組關聯分析(GWAS)和交叉驗證過程,能夠有效地捕捉非加性效應并考慮不同SNP的相對重要性。
![]()
為系統評估GWKBR的性能,研究團隊在模擬數據、多種動植物數據集以及人類疾病數據上開展了廣泛驗證,涉及云杉、小麥、玉米、牛和豬等多個物種,共分析23個性狀,其中包括16個連續性狀和7個二分類性狀。結果表明,GWKBR在23個性狀中有13個取得了最高的預測準確性,另有7個性狀位居第二,整體表現出良好的可靠性和穩健性。尤其在非加性遺傳效應較強的數據集中,GWKBR相較于多種現有方法表現出更明顯的優勢。
進一步分析表明,GWKBR的優勢主要來源于兩個方面:一是能夠通過加權高斯核更充分地捕捉非加性遺傳效應,提升對復雜性狀的預測能力;二是能夠結合GWAS信息、交叉驗證和貝葉斯優化策略,在不同數據場景下自適應地選擇更優核函數并實現超參數優化,從而提高模型對異質遺傳背景的適應性。
該研究開發的GWKBR軟件已實現GWAS分析、SNP權重計算、模型構建、模型選擇及基因組預測等流程的自動化(https://github.com/Wangxuer521/GWKBR/),可為動植物及人類復雜性狀的遺傳評估研究提供實用工具,也為跨物種、跨性狀的基因組預測方法研發提供了新的思路。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.