![]()
![]()
斑馬魚跨膜蛋白81,圖片來源 歐洲生物信息研究所
潘 展 | 編譯
2020年11月末,DeepMind推出了具有變革意義的蛋白質結構預測工具AlphaFold2。莆一問世它便向世人展示了人工智能在推動科學進步方面的強大威力。
01
蛋白質與AlphaFold
蛋白質是大多數生理活動的承載者,它由長而獨特的氨基酸鏈組成,精確折疊成三維結構。結構基本定義了蛋白質的功能,因此了解其結構對于藥物發現和疾病理解至關重要。
如果蛋白質折疊錯誤,輕則失去功能,重則直接導致疾病產生,如阿爾茨海默病和帕金森病等疾病。然而數十年來,確定這些結構一直是一項艱巨的任務。
在2020年CASP 14蛋白質結構預測競賽中,AlphaFold 2僅憑氨基酸序列就以驚人的準確度預測了蛋白質的結構,這一成就解決了一個生物學上50年重大挑戰,被視為科學人工智能的真正誕生。
隨后,DeepMind與歐洲生物信息研究所(EMBL-EBI)合作推出了AlphaFold 蛋白質結構數據庫,并向全球免費開放,AlphaFold一舉成為全球科學工具。
2023年DeepMind進一步推出AlphaFold3,該模型可以預測生命中所有分子的結構和相互作用——不僅是蛋白質,還有DNA、RNA和配體(構成大多數藥物的小分子)。它還能生成整個分子復合物的關節三維結構,從而全面了解潛在藥物分子如何與其目標蛋白結合,或蛋白質如何與遺傳物質相互作用。
如今,AlphaFold蛋白質數據庫包括了超過2.4億個蛋白質結構的預測,實現了原本需要數億年實驗解決的問題。該數據庫已被190多個國家的300多萬名研究人員使用,其中包100多萬低收入和中等收入國家的用戶。超過30%的AlphaFold相關研究聚焦于更好地理解疾病,從而造福人類福祉。
02
加速科研進程
AlphaFold顯著提升了科學家新發現的速度。一項其影響力對比試驗顯示,使用 AlphaFold的研究人員向蛋白質數據銀行(PDB,一個實驗性蛋白質結構模型數據庫)提交的蛋白質結構數量,比不使用AlphaFold的基準組結構生物學研究人員多約50%。
此外,與使用人工智能、結構生物學及蛋白質結構預測領域其他前沿方法的研究人員相比,使用 AlphaFold2 的研究人員向 PDB 提交結構的比例也更高。
![]()
蛋白質提交量激增 圖片來源:《自然》雜志
根據《自然》雜志的介紹,維也納分子病理學研究所的生物化學家安德里亞?保利(Andrea Pauli)的經歷很具代表性。在一項研究中,他借助AlphaFold找到了一條原本可能永遠無法找到的研究路徑。他在斑馬魚(Danio rerio)卵子研究中發現了一種名為Bouncer的蛋白質,這種蛋白質對受精過程至關重要,但他始終難以弄清Bouncer蛋白是如何識別精子細胞的。恰在此時,AlphaFold2橫空出世,根據其預測顯示,一種名為Tmem81的蛋白質能穩定另外兩種精子蛋白形成的復合物,并為Bouncer蛋白創造一個結合位點。后續實驗證實了該工具的預測結果。“AlphaFold 加速了發現進程,” 保利說,“我們的每個項目都會用到它。”
保利在其論文中引用了《自然》雜志介紹AlphaFold2的文章,該篇文章的引用量目前已近4萬。此外,超過200000篇論文將AlphaFold 2的元素納入其方法論。這些數據足以證明AlphaFold對科學界的影響。
![]()
介紹AlphaFol的論文被引用量,圖片來源 《自然》雜志
截止目前,AlphaFold服務器已經幫助全球數千名研究人員實現了超過800萬次結構和相互作用的預測。它正在賦能全球非商業研究人員利用這項技術,加速他們構建和測試新假設的能力。
03
數字生物學的新紀元
AlphaFold2 能迅速產生影響,部分原因在于它的易獲取性,開源讓研究人員很快就能自行大規模運行這款軟件,并運用于多個領域。比如牛津大學團隊利用它預測瘧疾關鍵蛋白 Pfs48/45 的全長結構,為新型疫苗設計提供參考;馬耳他大學科學家通過它模擬罕見基因變異的蛋白質結構,助力早發性家族性骨質疏松癥的遺傳因素識別等。
同時,它還運用于追溯蛋白質演化、優化塑料降解酶等方面的研究。總之,AlphaFold已成為全球科研人員依賴的基礎工具。
![]()
AlphaFold助力抗癌新藥研究 圖片來源:歐洲生物信息研究所
其中,又以對藥物設計與篩選方面的影響最為突出。AlphaFold 3提供了前所未有的細胞視角,將推動藥物發現過程的轉變,并開啟“數字生物學”時代。
早在2021年,DeepMind就拆分成立了Isomorphic Labs,其核心目標是借助人工智能革新藥物研發模式,其開發的藥物設計引擎覆蓋藥物發現全生命周期,能完成小分子設計、虛擬篩選、結構優化等可工程化的研發流程,可將藥物發現階段的成本削減 30 - 40%,周期縮短一年以上。目前,Isomorphic Labs已與多家大型藥企達成合作,合同金額已達數十億美元。
04
引領AI for Science潮流
AlphaFold 的成功,啟發了一系列相關模型的誕生,為人工智能在科學研究領域的應用開辟了廣闊的道路。
AlphaGenome是一個全新的DNA序列模型,為解讀人類基因非編碼序列的功能提供了新的視角和工具。AlphaMissense則專注于預測人類基因組中錯義突變的致病性。它們可以利用人工智能評估導致疾病的基因突變。
AlphaProteo模型可以設計出新型高強度蛋白質結合劑,靶向包括與癌癥和糖尿病相關的多種分子。這些模型正在加深我們對復雜疾病的理解,最終推動新療法的發展。
更重要的是,科學家正將AI賦能各學科,從核聚變、地球科學到整體科學發現,追求下一個類似AlphaFold的突破。AlphaFold是這股潮流的引領者,必將在人類科學事業中留下濃重的一筆。
https://www.nature.com/articles/d41586-025-03886-9
https://deepmind.google/blog/alphafold-five-years-of-impact/
青科沙龍第179期 | Cell-RNA天然免疫與異種屏障
Deep Science預印本
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.