編譯丨王聰
編輯丨王多魚
排版丨水成文
日前,國際頂尖學(xué)術(shù)期刊Nature在其官網(wǎng)頭條報道了 AlphaFold2 誕生這 5 年對科學(xué)的變革——自 2020 年問世以來,谷歌 DeepMind 推出的的這一改變游戲規(guī)則的 AI 工具已幫助世界各地的研究人員預(yù)測了數(shù)億種蛋白質(zhì)的三維結(jié)構(gòu)【1】。
![]()
2020 年 11 月底,谷歌旗下公司DeepMind推出了AlphaFold2,這是一款用于預(yù)測蛋白質(zhì)三維結(jié)構(gòu)的人工智能(AI)模型,其能夠僅根據(jù)蛋白質(zhì)的氨基酸序列就精準預(yù)測出蛋白質(zhì)的三維結(jié)構(gòu)。實際上,其上一代版本于 2018 年發(fā)布,但預(yù)測準確率有限,并未獲得多少關(guān)注。
2021 年 7 月,DeepMind團隊在Nature期刊發(fā)表論文,公布了 AlphaFold2 的開源代碼,并發(fā)表了完整方法論,詳盡細致說明了 AlphaFold2 是如何做到精確預(yù)測蛋白質(zhì)三維結(jié)構(gòu)的【2】。
![]()
如今,問世五年的AlphaFold2變革了科學(xué)研究的游戲規(guī)則,幫助世界各地的研究人員預(yù)測了地球上各種生命的數(shù)億種蛋白質(zhì)的三維結(jié)構(gòu),帶來了結(jié)構(gòu)生物學(xué)的第二次復(fù)興。
維也納大學(xué)的Andrea Pauli一直在探究精子和卵子是如何結(jié)合在一起的。2018 年,她的團隊在斑馬魚的卵子表面發(fā)現(xiàn)了一種名為“Bouncer”的蛋白質(zhì),該蛋白對于受精至關(guān)重要,但他們一直難以證明 Bouncer 是如何識別精子的。
就在此時,第一代的AlphaFold誕生了,2020 年,第二代的AlphaFold2誕生,2021 年 10 月,DeepMind 團隊進一步推出了用于預(yù)測蛋白-蛋白復(fù)合物的結(jié)構(gòu)和相互作用的AlphaFold-Multimer。
Andrea Pauli團隊利用AlphaFold-Multimer發(fā)現(xiàn)了在精子和卵子結(jié)合中發(fā)揮關(guān)鍵的“媒人”作用的三種蛋白質(zhì)——TMEM81、IZUMO1和SPACA6,沒有這三種蛋白質(zhì),從魚類到哺乳動物的有性繁殖可能會陷入死胡同。這一發(fā)現(xiàn)也顛覆了之前的觀點,之前認為只需要兩種蛋白質(zhì)(一種在卵子上,另一種在精子上)就足以確保受精。而這一發(fā)現(xiàn)表明,受精作用比之前認為的要更加復(fù)雜,并不是“一把鑰匙開一把鎖”的舊觀點了。
該研究以:A conserved fertilization complex bridges sperm and egg in vertebrates 為題,于 2024 年 10 月 17 日發(fā)表在了國際頂尖學(xué)術(shù)期刊Cell上【3】。
![]()
該研究表明,TMEM81是在魚類和小鼠中必需的雄性生育因子,它與IZUMO1和SPACA6這兩個之前已知的雄性生育因子相互作用,形成一個蛋白質(zhì)復(fù)合物——TMEM81-IZUMO1-SPACA6,該蛋白質(zhì)復(fù)合物分別與哺乳動物卵子上的JUNO蛋白或魚類卵子上的Bouncer蛋白結(jié)合,從而連接精子和卵子膜,介導(dǎo)精子-卵子的結(jié)合。
![]()
對于Andrea Pauli而言,AlphaFold 為他們照亮了一條原本可能永遠都找不到的道路。她表示,AlphaFold 加快了發(fā)現(xiàn)的速度,如今,我們每個項目都會用到它。
如今,這篇描述AlphaFold2的Nature論文已獲得接近 4 萬次引用。與同時期的許多其他被大量引用的生命科學(xué)和醫(yī)學(xué)領(lǐng)域的論文不同,研究人員對 AlphaFold 的興趣似乎并未減退。
![]()
AlphaFold2 不僅得到了全世界科學(xué)家的廣泛使用,更為它的開發(fā)者John Jumper和Demis Hassabis贏得了獲得了 2024 年諾貝爾化學(xué)獎。
研究人員認為,AlphaFold2 能夠在全世界迅速產(chǎn)生影響,部分原因在于其易用性。DeepMind 向科學(xué)家們免費提供了底層代碼和其他參數(shù),很快科學(xué)家們就能夠自行大規(guī)模運行該系統(tǒng)。
據(jù)統(tǒng)計,全世界有 190 多個國家的約 330 萬用戶(其中超過 100 萬用戶來自低收入和中等收入國家)訪問了由歐洲分子生物學(xué)實驗室-歐洲生物信息研究所(EMBL-EBI)托管的AlphaFold 數(shù)據(jù)庫(AFDB),該數(shù)據(jù)庫包含超過2.4 億個蛋白質(zhì)結(jié)構(gòu)預(yù)測結(jié)果,涵蓋了地球上幾乎所有已知的蛋白質(zhì)。
![]()
AlphaFold 影響最為顯著的領(lǐng)域似乎是結(jié)構(gòu)生物學(xué)。本周發(fā)布的報告顯示,與未使用 AlphaFold 的結(jié)構(gòu)生物學(xué)研究人員相比,使用該工具的研究人員向蛋白質(zhì)數(shù)據(jù)庫(PDB)提交的蛋白質(zhì)結(jié)構(gòu)數(shù)量高出約 50%。此外,使用 AlphaFold2 的研究人員向 PDB 提交蛋白質(zhì)結(jié)構(gòu)的數(shù)量也高于那些采用人工智能、結(jié)構(gòu)生物學(xué)及蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域其他前沿方法的研究人員。
John Jumper表示,他特別欣慰的是,使用 PDB 數(shù)據(jù)訓(xùn)練的 AlphaFold2 在推斷蛋白質(zhì)結(jié)構(gòu)方面發(fā)揮了巨大作用。預(yù)測出的結(jié)構(gòu)有助于研究人員理解 X 射線晶體學(xué)和冷凍電鏡產(chǎn)生的原始數(shù)據(jù)。很高興 AlphaFold2 能幫助那些為我們提供數(shù)據(jù)的人。
![]()
另一個受到 AlphaFold 影響的領(lǐng)域是計算生物學(xué)。如果你去參加計算生物學(xué)領(lǐng)域的學(xué)術(shù)會議,你會發(fā)現(xiàn),幾乎每場報告都會提到 AlphaFold,其在包括 AI 輔助藥物發(fā)現(xiàn)和 AI 蛋白質(zhì)設(shè)計在內(nèi)的計算密集型領(lǐng)域都有很好的應(yīng)用。
在 AlphaFold2 發(fā)布后的幾周到幾個月時間里,從事蛋白質(zhì)結(jié)構(gòu)預(yù)測研究的研究人員經(jīng)歷了一場“存在危機”,他們一度感覺自己的主要目標已被解決。然而,AlphaFold 卻很快開辟了新的研究方向——AI 蛋白質(zhì)設(shè)計,并帶來了新的關(guān)注和資金投入。計算生物學(xué)家不但沒有被取代,現(xiàn)在反而可能是做計算生物學(xué)家的好時機。
![]()
此外,直接引用 AlphaFold2 或使用其預(yù)測的蛋白質(zhì)數(shù)據(jù)庫的科學(xué)家數(shù)量只是該工具影響力的一部分。對于 AlphaFold2 相關(guān)研究的更廣泛分析顯示,已有超過 20 萬項研究直接或間接使用了 AlphaFold,涉及近 80 萬名科學(xué)家的工作。
John Jumper表示,將 AlphaFold 的生物學(xué)洞見轉(zhuǎn)化為實際應(yīng)用(比如藥物研發(fā)),還需要時間。2024 年發(fā)布的AlphaFold3更有助于藥物發(fā)現(xiàn),它能夠預(yù)測潛在療法與蛋白質(zhì)的相互作用,但幕后還有很多工作要做。實際上,AlphaFold2已經(jīng)開始幫助研究人員解開疾病的生物學(xué)機制,確信將會有病人因 AlphaFold2 帶來的藥物或療法而治愈出院。
1. https://www.nature.com/articles/d41586-025-03886-9
2. https://www.nature.com/articles/s41586-021-03819-2
3. https://www.cell.com/cell/fulltext/S0092-8674(24)01093-6
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.