![]()
撰文丨王聰
編輯丨王多魚
排版丨水成文
在生物醫(yī)藥領(lǐng)域,RNA 靶向的小分子藥物正成為繼蛋白質(zhì)靶向藥物之后的新前沿。然而,一個關(guān)鍵難題長期制約著該領(lǐng)域的發(fā)展——大多數(shù)疾病相關(guān)的 RNA 缺乏精確的三級結(jié)構(gòu)信息,而傳統(tǒng)計算方法恰恰依賴這些結(jié)構(gòu)信息來預(yù)測小分子與 RNA 的相互作用。
2026 年 1 月 2 日,清華大學張強鋒團隊與北京大學汪陽明團隊合作,在Nature Biotechnology期刊發(fā)表了題為:Predicting small molecule–RNA interactions without RNA tertiary structures 的研究論文。
該研究開發(fā)了一種名為SMRTnet的深度學習工具,成功實現(xiàn)了在不依賴 RNA 三級結(jié)構(gòu)的情況下,精準預(yù)測小分子-RNA的相互作用。通過消除對 RNA 三級結(jié)構(gòu)的需求,SMRTnet 擴大了可靶向的 RNA 靶標的范圍,從而加快 RNA 靶向治療藥物的發(fā)現(xiàn)。
![]()
傳統(tǒng)方法的瓶頸與 SMRnet 的創(chuàng)新突破
RNA 作為生命體內(nèi)的重要功能分子,其復(fù)雜結(jié)構(gòu)可以被小分子選擇性調(diào)控,從而影響 pre-mRNA 剪接、mRNA 翻譯、RNA-蛋白質(zhì)相互作用等多種生物學過程。RNA 靶向的小分子藥物,擴展了治療疾病的新靶點,尤其是那些“不可成藥”蛋白相關(guān)基因。
然而,傳統(tǒng)計算方法如分子對接工具 AutoDock Vina、RLDOCK 等需要已知 RNA 的三級結(jié)構(gòu)信息,而大多數(shù)疾病相關(guān) RNA 正好缺乏這類結(jié)構(gòu)信息。這正是SMRTnet要解決的核心問題。
SMRTnet 的創(chuàng)新之處在于,它整合了兩種大語言模型、卷積神經(jīng)網(wǎng)絡(luò)和圖注意力網(wǎng)絡(luò),通過多模態(tài)數(shù)據(jù)融合技術(shù),僅使用 RNA 序列和二級結(jié)構(gòu)信息就能預(yù)測小分子與 RNA 的結(jié)合能力。
![]()
研究團隊首先從蛋白質(zhì)數(shù)據(jù)庫(PDB)中收集了 1061 個高質(zhì)量的三維結(jié)構(gòu),這些結(jié)構(gòu)至少包含一個 RNA 和一個小分子,由此構(gòu)建了包含 8672 個 RNA 片段與小分子相互作用的數(shù)據(jù)集,用于訓(xùn)練和測試 SMRTnet 模型。
SMRTnet 表現(xiàn)出色,大幅超越現(xiàn)有工具
在對 SMRTnet 數(shù)據(jù)集的測試中,SMRTnet 表現(xiàn)穩(wěn)健,在五折交叉驗證中平均接收者操作特征曲線下面積(auROC)達到 0.830-0.844,顯著優(yōu)于其他工具。
特別是在誘餌評估任務(wù)中,SMRTnet 的平均排名高達 92.6%,遠超過四種分子對接工具(27.3%-46.6%)和兩種深度學習工具(16.0%-23.8%)。這意味著 SMRTnet 能更準確地從結(jié)構(gòu)相似的小分子中識別出真正的結(jié)合分子。
研究團隊還進行了消融研究,評估了 SMRTnet 各組件對性能的貢獻。結(jié)果顯示,RNA 序列和結(jié)構(gòu)信息最為關(guān)鍵,而多模態(tài)數(shù)據(jù)融合模塊也有助于實現(xiàn)高性能預(yù)測。
值得注意的是,當研究團隊使用預(yù)測的二級結(jié)構(gòu)而非實驗得出的結(jié)構(gòu)時,模型性能有所下降,這凸顯了實驗確定的 RNA 二級結(jié)構(gòu)對獲得高預(yù)測精度至關(guān)重要。
精準定位結(jié)合位點,實驗驗證效果顯著
除了預(yù)測結(jié)合能力,SMRTnet 還能識別 RNA 上的小分子結(jié)合位點。通過 Grad-CAM 算法,研究團隊量化了每個核苷酸對預(yù)測結(jié)合分數(shù)的貢獻,從而確定高注意力區(qū)域(HAR)作為潛在結(jié)合位點。
在與實驗確定的結(jié)合位點比較時,SMRTnet 在多個數(shù)據(jù)集上表現(xiàn)出色,平均 auROC 達到 0.695-0.793,表明其結(jié)合位點預(yù)測的準確性。
研究團隊將 SMRTnet 應(yīng)用于十種疾病相關(guān)的 RNA 靶點,在一個包含 7350 種天然產(chǎn)物和代謝物化合物的庫中進行篩選。實驗結(jié)果令人振奮:在 190 個預(yù)測的小分子-RNA 相互作用中,40 個被實驗驗證為結(jié)合分子,驗證率平均達到21.1%。
更重要的是,大多數(shù)驗證的結(jié)合表現(xiàn)出微摩爾級的親和力,這是 RNA 靶向藥物發(fā)現(xiàn)中常見的初始命中范圍。有六個相互作用甚至表現(xiàn)出納摩爾級的親和力,顯示出發(fā)現(xiàn)高親和力結(jié)合劑的潛力。
靶向 MYC IRES:從預(yù)測到功能驗證
MYC 是許多人類癌癥的標志,但一直被認為是“不可成藥”的靶點。研究團隊重點關(guān)注了MYC IRES(內(nèi)部核糖體進入位點),這是控制該癌基因的一個可行策略。
針對 MYC IRES 的大規(guī)模實驗驗證顯示,SMRTnet 預(yù)測的結(jié)合分數(shù)與實驗驗證率之間存在明顯的正相關(guān)。結(jié)合分數(shù)在 0.9-1.0 范圍內(nèi)的預(yù)測,驗證率高達 28.6%,而隨著結(jié)合分數(shù)的降低,驗證率穩(wěn)步下降。
在鑒定的 15 種 MYC IRES 結(jié)合劑中,研究團隊重點關(guān)注了鹽酸伊立替康三水合物(IHT),因為它滿足藥物開發(fā)的多個標準,包括理化特性和藥物化學特性。
![]()
通過 SMRTnet 預(yù)測,IHT 的結(jié)合位點被精確定位在 MYC IRES 的內(nèi)部環(huán)(5'UUCG/3'ACCC)上。為驗證這一預(yù)測,研團隊設(shè)計了 20 種 MYC IRES 的變體,結(jié)果顯示,預(yù)測結(jié)合分數(shù)的變化趨勢與實驗驗證率高度一致,證實了 SMRTnet 結(jié)合位點預(yù)測的可靠性。
在功能實驗中,IHT 在 HeLa 細胞中使 MYC mRNA 水平降低 56.9%,MYC 蛋白水平降低 71.6%,效果超過了已知的 MYC-RiboTAC。此外,在三種依賴 MYC 的癌細胞系(HeLa、Jurkat 和 Raji)中,IHT 使細胞增殖減少了 19.6%-48.4%,細胞凋亡增加了 56.6%-124.2%。
前景與展望:AI 驅(qū)動 RNA 靶向藥物開發(fā)新時代
SMRTnet 代表了小分子-RNA 相互作用預(yù)測的重要進展。通過整合二級結(jié)構(gòu)信息和大語言模型,它克服了傳統(tǒng)方法的局限性,擴展了疾病相關(guān) RNA 靶點的范圍。
當前,實驗驗證的小分子-RNA 相互作用知識在 RNA 類型和小分子多樣性方面仍然有限。未來,隨著化學-RNA 相互作用組學、轉(zhuǎn)錄組學和功能篩選等多組學數(shù)據(jù)的積累,AI 方法將能同時預(yù)測結(jié)合相互作用和下游生物學效應(yīng),從而加速 RNA 靶向治療藥物的開發(fā)。
這項研究不僅展示了 SMRTnet 在小分子-RNA 相互作用篩選中的有效性,更揭示了 AI 方法在 RNA 靶向小分子治療藥物開發(fā)中的巨大潛力。隨著更多高質(zhì)量數(shù)據(jù)的積累和算法的進一步優(yōu)化,AI 驅(qū)動的 RNA 靶向藥物開發(fā)有望在未來幾年取得更多突破性進展。
論文鏈接:
https://www.nature.com/articles/s41587-025-02942-z
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.