![]()
編輯丨王多魚
排版丨水成文
生物分子的定向進(jìn)化是一個(gè)迭代的過(guò)程。盡管語(yǔ)言模型(language model,LM)的進(jìn)步加快了蛋白質(zhì)的進(jìn)化,但高效的 RNA 進(jìn)化仍是一項(xiàng)挑戰(zhàn)。由于結(jié)合特性而被篩選出來(lái)的RNA 適配體(RNA aptamer)為解決這一挑戰(zhàn)提供了一個(gè)理想的系統(tǒng),然而傳統(tǒng)的適配體發(fā)現(xiàn)仍然依賴于勞動(dòng)密集型的多輪篩選。
2026 年 2 月 6 日,中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院合成生物學(xué)研究所王宇團(tuán)隊(duì)等在Nature Biotechnology期刊發(fā)表了題為:Single-round evolution of RNA aptamers with GRAPE-LM 的研究論文。
該研究開(kāi)發(fā)了一個(gè)用于RNA 適配體一輪式高效進(jìn)化的生成式人工智能框架——GRAPE-LM(Generator of RNA Aptamers Powered by activity-guided Evolution and Language Model),GRAPE-LM 將基于Transfomer的條件自編碼器與核酸語(yǔ)言模型(Nucleic Acid Language Model)相結(jié)合,并由源自細(xì)胞內(nèi)環(huán)境的基于 CRISPR-Cas 的適配體篩選數(shù)據(jù)引導(dǎo)。
![]()
核酸適配體(aptamer)由諾獎(jiǎng)得主Jack Szostak命名,是一類短的單鏈 DNA(ssDNA)或 RNA 寡核苷酸,能夠折疊形成特定三維結(jié)構(gòu),并以“結(jié)構(gòu)分子”的方式高親和力結(jié)合蛋白或小分子,從而具備開(kāi)發(fā)成為核酸藥物和診斷探針的潛力。
然而,核酸適配體的發(fā)現(xiàn),長(zhǎng)期依賴指數(shù)富集的配體系統(tǒng)進(jìn)化技術(shù)(SELEX),通常需要多輪、強(qiáng)人工參與的篩選與優(yōu)化;更關(guān)鍵的是,在體外簡(jiǎn)化條件下獲得的核酸適配體,親和力和特異性常常不高,限制了其開(kāi)發(fā)成核酸藥物和探針的潛力。
王宇課題組在既往工作中提出了CRISmers(CRISPR/Cas-based aptamers screening system),將核酸適配體篩選從溶液和細(xì)胞表面體系推進(jìn)到細(xì)胞內(nèi)環(huán)境,使篩選過(guò)程天然包含內(nèi)源生物學(xué)機(jī)制,體現(xiàn)了內(nèi)源折疊構(gòu)象、相互作用特異性、充分的分子競(jìng)爭(zhēng)等關(guān)鍵變量,從源頭提升生物學(xué)相關(guān)性。在 CRISmers 篩選體系中,每個(gè)細(xì)胞作為一個(gè)獨(dú)立的物理微單元,其作用類似于微流控液滴,能夠有效隔離不同分子間的交叉反應(yīng),從而顯著降低背景噪音。與此同時(shí),該系統(tǒng)以細(xì)胞存活等表型變化作為功能性的篩選輸出方式,相較于傳統(tǒng)的體外親和力篩選,其功能相關(guān)性也同時(shí)得到了顯著提升。
不過(guò),胞內(nèi)篩選不可避免面臨“遞送與細(xì)胞數(shù)量”帶來(lái)的通量上限:以 CRISmers 為代表的胞內(nèi)篩選體系,文庫(kù)規(guī)模受轉(zhuǎn)染/遞送效率與細(xì)胞攝入能力限制,可能錯(cuò)過(guò)大量潛在有效序列。也正是在這一瓶頸處,AI 驅(qū)動(dòng)的“數(shù)字進(jìn)化”開(kāi)始展現(xiàn)決定性價(jià)值。
在這項(xiàng)最新研究中,研究團(tuán)隊(duì)進(jìn)一步提出了GRAPE-LM(Generator of RNA Aptamers Powered by activity-guided Evolution and Language Model),將“胞內(nèi)篩選數(shù)據(jù)”與“核酸語(yǔ)言模型”耦合為一條端到端的一輪式高效進(jìn)化路徑:模型以 Transformer 條件自編碼器為骨架,融合核酸語(yǔ)言模型,并由 CRISmers 在胞內(nèi)環(huán)境產(chǎn)生的篩選數(shù)據(jù)提供“活性引導(dǎo)”,實(shí)現(xiàn)RNA適配體的一輪進(jìn)化與生成。
在 GRAPE-LM 中,活性引導(dǎo)機(jī)制將模型推向更高活性的方向,預(yù)訓(xùn)練核酸語(yǔ)言模型用于提出合理的高質(zhì)量候選序列。該框架在三類跨度顯著的靶標(biāo)上完成驗(yàn)證——人 T 細(xì)胞受體 CD3ε、SARS-CoV-2 刺突蛋白的 RBD,以及人源致癌轉(zhuǎn)錄因子 c-Myc(一種胞內(nèi)無(wú)序蛋白)。
更重要的是,GRAPE-LM 將“實(shí)驗(yàn)進(jìn)化”從傳統(tǒng)的多輪循環(huán),重構(gòu)為“物理進(jìn)化+數(shù)字優(yōu)化”的兩階段:第一階段由 CRISmers 在細(xì)胞內(nèi)完成一輪篩選,第二階段由語(yǔ)言模型在更大序列空間中進(jìn)行數(shù)字化優(yōu)化與外推;在三類靶標(biāo)上,僅用 “ 一輪 ” 即可獲得優(yōu)于既往 SELEX 6–16 輪所得到的適配體的先導(dǎo)序列。這種效率躍遷也體現(xiàn)在起始文庫(kù)需求上: CRISmers+GRAPE-LM 路線可在約 108 規(guī)模的起始文庫(kù)上工作,而經(jīng)典 SELEX 常需要 1014–1016 量級(jí);換言之,前者僅需后者約百萬(wàn)分之一到億分之一的初始文庫(kù)規(guī)模。
在 CRISmers+GRAPE-LM 的新范式中,CRISPR 脫離了基因編輯的框架,在這里扮演的是“高保真胞內(nèi) RNA 數(shù)據(jù)發(fā)動(dòng)機(jī)”,捕獲 SELEX 等體外方法難以復(fù)現(xiàn)的胞內(nèi)內(nèi)源生物學(xué)機(jī)制 ;而 GRAPE-LM 則通過(guò)外推有限起始文庫(kù),補(bǔ)足 CRISmers 通量受限的短板,并且引導(dǎo)生成更高活性 RNA 適配體。
![]()
加速 RNA 適配體進(jìn)化的強(qiáng)大新范式
這一工作僅僅將 CRISmers 和 GRAPE-LM 兩個(gè)工具使用一次。面向未來(lái),多輪迭代有望進(jìn)一步提升分子質(zhì)量和成藥性。此外,GRAPE-LM 僅僅應(yīng)用了語(yǔ)言模型,物理模型的加入有望實(shí)現(xiàn)生成能力的進(jìn)一步加強(qiáng)。該技術(shù)路線也已成功用于多肽分子的高效發(fā)現(xiàn),并與某知名藥企合作開(kāi)展藥物開(kāi)發(fā)(未發(fā)表結(jié)果)。
在與王宇的通訊中,核酸適配體領(lǐng)域開(kāi)創(chuàng)者Jack Szostak評(píng)價(jià) CRISmers 和 GRAPE-LM 的工作 “ 非常有創(chuàng)造性,令人印象深刻 ” ( very creative and impressive )。在論文審稿過(guò)程中,審稿人評(píng)價(jià)該工作 “ 超級(jí)創(chuàng)新 ” ( super innovative ),并被編輯團(tuán)隊(duì)選為亮點(diǎn)論文,邀請(qǐng)作者發(fā)表Research Briefing介紹論文成果和研究歷程。同時(shí),Nature Biotechnology編輯團(tuán)隊(duì)發(fā)表評(píng)論,表達(dá)了對(duì)這項(xiàng)工作的 “ 興奮 ”(exciting) 。
![]()
深圳大學(xué)人工智能學(xué)院助理教授張軍和中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院合成生物學(xué)研究所助理研究員張菊為論文共同第一作者。中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院合成生物學(xué)研究所王宇研究員為論文通訊作者,天津大學(xué)藥學(xué)院張陽(yáng)教授和深圳大學(xué)人工智能學(xué)院張軍助理教授為論文共同通訊作者。唐少軒、劉傳承、蔡雨珊、曾浩、孟翔杰、柳貝作為參與作者,對(duì)該工作做出了重要貢獻(xiàn)。
論文鏈接:
https://www.nature.com/articles/s41587-026-03007-5
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.