在人體腸道內,數以萬億計的微生物與我們的健康息息相關,其中噬菌體——專門感染細菌的病毒,扮演著調控菌群平衡的關鍵角色。然而,由于技術限制,絕大多數噬菌體及其與細菌的對應關系仍是未知的“暗物質”,阻礙了科學家利用它們來治療肥胖、炎癥性腸病等疾病。傳統的噬菌體宿主預測方法,要么依賴有限的基因數據庫,要么受限于預測精度,難以滿足精準醫療的需求。
2026年2月26日,深圳大學與華大生命科學研究院團隊在《自然·通訊》上發表題為“通過關鍵蛋白利用大語言模型實現高分辨率噬菌體-宿主分配”的研究。該研究開發了名為VirHost Hunter的新框架,通過人工智能技術,僅利用噬菌體的尾部蛋白和裂解酶序列,便能高效、高精度地預測其細菌宿主,為腸道微生物組研究和精準療法開辟了新路徑。
![]()
研究團隊首先驗證了該框架設計的三大核心優勢。結果顯示,同時使用蛋白質和DNA特征進行預測,其準確率在兩種測試數據集上分別達到90.81%和89.27%,顯著優于僅使用單一特征。進一步分析表明,噬菌體的尾部蛋白和裂解酶作為“鑰匙”,在預測宿主(門、屬、種水平)時的準確性遠超頭蛋白等非特異性蛋白。尤為重要的是,通過引入蛋白質語言模型(如ProtT5)和視覺轉換器(ViT),該框架在低序列相似度的情況下,依然能捕捉蛋白質間的功能同源性,其預測精度遠超傳統方法,性能差距隨著序列相似度降低而顯著拉大。
隨后,團隊將模型校準,專門用于尋找與疾病相關的腸道細菌的噬菌體。在對60種與動脈粥樣硬化、炎癥性腸病和肥胖相關的細菌進行預測時,基于裂解酶的VirHost Hunter模型在科、屬、種水平上的準確率高達98.17%、97.56%和95.90%。在與傳統的CRISPR間隔序列法對比時,兩者展現出極佳的互補性,結合使用能大幅提升預測的準確率和覆蓋率。利用這一工具,團隊對全球最全面的腸道噬菌體數據庫(GPD)進行重新分析,將原本僅28.66%的宿主分配率提升至62.66%,新發現了大量靶向如阿克曼菌和普雷沃氏菌等關鍵菌株的未知噬菌體,這些細菌與多種免疫和代謝疾病相關。
![]()
基于以上發現,團隊構建了“腸道噬菌體裂解酶數據庫”(GPLD),收錄了超過11.7萬個靶向29個疾病相關菌科的裂解酶。通過對這些裂解酶進行序列相似性網絡分析,發現它們根據宿主菌門(如厚壁菌門、擬桿菌門)聚集,并鑒定出多個高度保守的功能基序,揭示了其結構和功能的多樣性。作為概念驗證,研究人員從數據庫中挑選了一個靶向肥胖相關菌巨單胞菌的裂解酶Ply491_6。體外實驗證實,該酶在極低濃度下即可特異性、高效地裂解巨單胞菌,而對其他常見腸道益生菌幾乎沒有影響,展現了其作為精準靶向療法的巨大潛力。
READING
BioPeers
歡迎關注本公眾號,所有內容歡迎點贊,推薦??,評論,轉發~
如有錯誤、遺漏、侵權或商務合作請私信小編~~
歡迎大家投稿課題組 研究進展 、招聘及招生宣傳~
所有文章只為科普、科研服務,無商業目的~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.