撰文丨王聰
編輯丨王多魚
排版丨水成文
在生命科學領域,RNA的三維(3D)結構解析一直是塊“硬骨頭”。與相對穩定的蛋白質不同,RNA 分子天生靈活多變,能在不同構象間切換,這對其功能至關重要,但也讓實驗測定其精確三維結構變得異常困難。此外,傳統的計算方法也常常束手無策。
然而,這一困局正被來自中國團隊的一項研究成果所打破。
2026 年 4 月 21 日,山東大學楊建益教授團隊(王文愷博士為論文第一作者)在 Nature 子刊Nature Machine Intelligence上發表了題為:Predicting RNA 3D structure and conformers using a pre-trained secondary structure model and structure-aware attention 的研究論文。
該研究開發了一個名為trRosettaRNA2的 AI 新算法,它不僅能夠高精度預測 RNA 的靜態三維結構,更能捕捉其動態構象變化,在國際權威結構預測競賽 CASP16 中,力壓包括AlphaFold3在內的所有對手,取得 RNA 結構預測自動算法組冠軍。此外,研究團隊還將其應用于核糖核酸酶 P RNA 的結構預測,結果顯示,即使沒有實驗數據,trRosettaRNA2 也能成功捕捉到其結構異質性,顯示出預測 RNA 多種構象的潛力。
![]()
核心創新:用“二維藍圖”指導“三維施工”
相較于蛋白質結構的解析和預測,確定RNA的三維(3D)結構和構象體,仍然是結構生物學中的一個重大挑戰,這主要是由于實驗數據的稀缺、RNA 分子固有的靈活性以及當前實驗和計算方法的局限性。
在這項新研究中,研究團隊的核心思路非常巧妙:既然 RNA 三維結構數據稀缺是主要瓶頸,那就另辟蹊徑,從海量且易得的 RNA 二級結構數據中尋找突破口。
我們可以把 RNA 想象成一棟復雜的建筑:一級結構(序列):就像建筑材料的排列順序;二級結構:是這些材料局部折疊形成的穩定“模塊”或“骨架藍圖”,例如哪些部分會配對形成雙螺旋,哪些部分會形成環;三級結構:最終建成的、具有完整功能的立體建筑。
trRosettaRNA2的創新在于,它內部集成了一個預訓練的二級結構(Secondary Structure,SS)先驗模塊。這個模塊在包含海量 RNA 二級結構信息的數據庫上進行了訓練,能像一位經驗豐富的建筑師,僅憑 RNA 序列就快速、準確地繪制出“二維結構藍圖”。這個模塊本身就是一個獨立的、性能頂尖的 RNA 二級結構預測工具——trRNA2-SS。
更重要的是,trRosettaRNA2并非簡單地將這份“藍圖”作為固定約束,而是通過一種名為 “二級結構感知注意力”(SS-aware attention)機制,讓神經網絡在預測三維坐標時,能動態地、有側重地參考這份藍圖信息,從而更精準地搭建出最終的“三維建筑”,甚至模擬出建筑在不同狀態下的幾種可能形態(即構象異構體)。
![]()
性能卓越:以小博大,超越巨頭
在嚴格的基準測試中,trRosettaRNA2展現出了令人矚目的性能:
精度領先:在標準測試集 TS28 上,trRosettaRNA2 的預測精度(以 RMSD 衡量)比其前代模型提升了 24%,并且在多項關鍵指標上優于AlphaFold3,同時產生的結構沖突更少,物理合理性更高。
效率驚人:trRosettaRNA2 的模型參數量僅為約 3000 萬,是 AlphaFold3 的約 1/12,RoseTTAFoldNA 的 1/2。其訓練成本也大幅降低,僅用單個 A100/A800 GPU 訓練了約 33天,遠低于其他主流方法。這真正實現了“小而精”的高效預測。
盲測奪冠:在最具挑戰性的 CASP16 RNA 結構盲測中(參賽者不知道所預測的 RNA 的實驗結構,純粹比拼預測能力),基于 trRosettaRNA2 的“Yang-Server”在全部 36 個 RNA 單體靶標上,位列所有自動化服務器第一名,總排名在 64 個參賽組中高居第四,僅次于三個人工干預團隊,超過了 AlphaFold3 服務器(排名第九)。
![]()
應用潛力:從靜態到動態
這項研究的另一大亮點是成功預測了 RNA 的構象異構體。研究團隊以核糖核酸酶 P(RNase P)RNA 為例,成功復現了其在原子力顯微鏡實驗中觀察到的多種構象,而這一切無需依賴任何實驗數據作為輸入。這意味著,trRosettaRNA2 不僅能給出 RNA 的“標準證件照”,還能推演出它的“動態生活影像”,為理解 RNA 如何通過形變來行使功能(例如基因調控、催化反應)提供了強大的計算工具。
trRosettaRNA2 的成功,標志著 RNA 三維結構預測領域邁出了堅實的一步。它通過巧妙地利用更豐富的二級結構數據作為先驗知識,以更高效、更精準的方式解決了三維結構預測的難題,并在國際頂級競賽中證明了其領先地位。這一成果不僅將極大推動非編碼 RNA 功能機制、RNA 藥物靶點發現等基礎研究,也為整個計算結構生物學提供了新的思路——在面對數據稀缺的挑戰時,融合多維度、多層次的信息可能是通往成功的關鍵路徑。
論文鏈接:
https://www.nature.com/articles/s42256-026-01223-x
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.