撰文丨王聰
編輯丨王多魚
排版丨水成文
在蛋白質科學領域,從蛋白質結構預測到蛋白質從頭設計,技術發(fā)展日新月異,從 AlphaFold 到 RFdiffusion,各種強大的 AI 工具層出不窮。 然而,對于大多數(shù)實驗室科學家來說,這些工具的使用門檻卻高得令人望而卻步。 此外,每個 AI 工具都有自己獨特的安裝要求、運行環(huán)境和數(shù)據(jù)格式,將它們整合到一個連貫的工作流程中,需要深厚的計算專業(yè)知識。
值得一提的是,GYDE 免費向學術界和工業(yè)界的蛋白質研究科學家開放,助力構建符合個性化需求的藥物發(fā)現(xiàn)分析平臺。
2026 年 3 月 27 日,基因泰克(Genentech)公司的研究人員在預印本平臺 bioRxiv 上發(fā)表了題為:GYDE: A collaborative drug discovery platform for AI-powered protein design and engineering 的研究論文。
基因泰克推出了一個開源、多功能、基于網(wǎng)絡的協(xié)作平臺——GYDE(Guide Your Design and Engineering),旨在讓實驗室科學家只需點擊鼠標即可調動前沿 AI 模型,輕松進行蛋白質和抗體的計算分析和設計。
GYDE 通過深度整合的可視化界面支持序列-結構-功能關系的探索,使研究人員能夠通過真實實驗數(shù)據(jù)或計算工具全面解析蛋白質功能決定因素。其直觀接口可無縫對接用于蛋白質/抗體結構預測、設計與下游分析的前沿 AI 模型。通過采用 Slivka 計算 API,平臺可靈活便捷地集成新工具與模型。該平臺還支持會話保存功能,方便研究者與其他用戶共享研究發(fā)現(xiàn),從而構建更具協(xié)作性的科研社區(qū)。
![]()
實驗室科學家的困境
現(xiàn)代藥物發(fā)現(xiàn)越來越依賴計算工具和 AI 模型,AlphaFold、RosettaFold、OpenFold 等 AI 模型現(xiàn)在已被常規(guī)用于預測新型蛋白質結構、可能影響蛋白質功能的構象變化以及蛋白質與其他分子之間的相互作用。ProteinMPNN、BindCraft、RFdiffusion 等 AI 模型則能夠實現(xiàn)治療性多肽、迷你蛋白和抗體的從頭設計。
然而,AI 工具開發(fā)的速度之快以及計算復雜性的增加,給計算科學家和非計算科學家都帶來了巨大挑戰(zhàn)。此外,每個 AI 工具都構建方式不同,難以在同一計算環(huán)境中協(xié)同工作。
要將這些工具連接起來供實驗室科學家使用,需要大量的技術專業(yè)知識和 IT 投入。即使所有平臺都安裝好了,第二個挑戰(zhàn)是每個工具的學習曲線,因為它們通常是為特定目的設計的,而不是為了連續(xù)的工作流程。這些問題使得協(xié)作或連續(xù)工作流程變得更加困難。商業(yè)解決方案雖然提供端到端的解決方案,但通常伴隨著非技術限制,例如昂貴的授權許可、專有代碼庫以及可能落后于新工具發(fā)布計劃的有限可定制性。
GYDE 的設計原則
該研究中推出的GYDE(Guide Your Design and Engineering),是一個開源、多功能且基于網(wǎng)絡的協(xié)作平臺,旨在讓實驗室科學家能夠輕松進行蛋白質和抗體的計算分析。
GYDE 平臺的設計遵循四個核心原則,這些原則直接針對上述挑戰(zhàn)——
無代碼用戶界面是 GYDE 的首要設計原則,與依賴最終用戶懂編碼的解決方案不同,GYDE 團隊認為無代碼用戶界面對于提高用戶采用率至關重要。
序列-結構-功能關系的緊密集成是蛋白質科學家熟悉的思維框架,GYDE 設計的界面允許這三者的集成,在單一環(huán)境中實現(xiàn)穩(wěn)健分析。
訪問最新工具和數(shù)據(jù)是應對計算結構生物學領域快速發(fā)展的關鍵。GYDE 需要一個靈活的后端服務運行器,允許輕松添加新工具,以便高效評估和及時使用。
協(xié)作功能解決了結構、序列和功能數(shù)據(jù)共享的障礙,通過將用戶會話存儲在集成數(shù)據(jù)集中,GYDE 實現(xiàn)了穩(wěn)健的數(shù)據(jù)存儲,并通過直觀的超鏈接共享功能與協(xié)作者共享。
![]()
GYDE 的網(wǎng)頁界面
GYDE 平臺的核心功能
GYDE 的網(wǎng)頁界面組織成不同但集成的組件,為用戶提供靈活的操作體驗。常用組件默認更容易訪問,主要包括以下七個核心模塊:
多序列比對查看器(MSA Viewer)是許多工作流程的起點,可以查看蛋白質序列。序列可以使用 MAFFT 進行蛋白質對齊,或通過抗體特異性對齊器如 Absolve 進行對齊,后者注釋互補決定區(qū)域。
結構可視化(Structural Visualization)使用 Mol* Viewer,使用戶能夠探索與 MSA Viewer 中選擇的一個或多個序列相關的分子結構。MSA 和 Mol* Viewer之間的序列-結構集成通過序列比對自動標準化序列和結構之間的殘基編號來實現(xiàn)。
繪圖組件(Plotting)支持基于上傳到 GYDE 數(shù)據(jù)表中的數(shù)據(jù)值快速創(chuàng)建直方圖或散點圖。這些數(shù)據(jù)值通常代表正在分析的蛋白質或突變體的功能特性。
序列到圖像查看器(Sequence-To-Image Viewer),允許查看許多計算分析產(chǎn)生的靜態(tài)圖像摘要。例如,像 AlphaFold 這樣的結構預測工具會產(chǎn)生 MSA 覆蓋率和置信度指標的圖表。
頻率分析(Frequency Analysis),通過顯示選定位置或具有選定保守水平的氨基酸分布,幫助識別保守殘基或過濾具有特定殘基的序列。
熱圖查看器(Heatmap Viewer),為飽和突變數(shù)據(jù)集提供簡潔和交互式的可視化,幫助導航和提煉這些復雜、豐富的數(shù)據(jù)矩陣信息。
序列標識(Sequence logo),集成了序列標識查看器,使用戶無需尋求其他軟件即可使用這種常見且信息豐富的蛋白質位置變異性可視化方法。
技術架構與集成
GYDE 采用模塊化架構,有助于隔離用戶界面、計算和數(shù)據(jù)管理組件的開發(fā),同時仍允許模塊間通信。
GYDE 服務器作為系統(tǒng)的中央樞紐,協(xié)調計算和數(shù)據(jù)管理操作。它處理與 GYDE UI 發(fā)送和接收數(shù)據(jù)的請求。為了運行計算工具,GYDE 集成了 Slivka 計算 API,為各種高性能計算資源提供作業(yè)運行器。這種與 Slivka 的集成,使 GYDE 能夠利用外部計算能力進行大規(guī)模數(shù)據(jù)處理和分析,從而增強 GYDE 的能力和可擴展性。
數(shù)據(jù)模型和管理,是 GYDE 數(shù)據(jù)管理系統(tǒng)的核心。數(shù)據(jù)集作為在具有訪問控制的集中存儲庫中存儲和共享信息的核心單元。這種結構支持實時協(xié)作,允許多個研究人員同時處理共享項目。
GYDE 數(shù)據(jù)集圍繞靈活的列式數(shù)據(jù)框架設計,集成了關鍵元數(shù)據(jù)。該模型高度適應,支持對藥物發(fā)現(xiàn)至關重要的專業(yè)領域特定數(shù)據(jù)類型,包括蛋白質、DNA 和 RNA 序列,以及像 SMILES 這樣的化學信息學格式。
![]()
GYDE 系統(tǒng)架構
實際應用案例
GYDE 已在多個案例研究中得到應用,展示了其在蛋白質工程和設計項目中的實用性。用戶報告了顯著的時間節(jié)省(在某些情況下從數(shù)天減少到幾分鐘或幾小時)和增強的協(xié)作效率。
單次跨膜多聚體研究中,研究人員使用 AlphaFold2-Multimer 生成蛋白質復合物預測,基于包含 1381 個提議相互作用的實驗蛋白質組學數(shù)據(jù)集。通過 GYDE 的數(shù)據(jù)上傳機制,將這些預測和計算指標與實驗篩選值以及關于相關蛋白質的任何現(xiàn)有結構的公共數(shù)據(jù)庫知識合并。
抗體工程工作流程是 GYDE 的另一個重要應用領域,GYDE 平臺支持抗體特異性工具,例如 Absolve 用于抗體 Fv 編號,Therapeutic Antibody Profiler 用于抗體表面特性分析,以及 ABodyBuilder 用于抗體結構預測。
這些工具的集成使研究人員能夠在統(tǒng)一環(huán)境中進行端到端的蛋白質或抗體的設計和優(yōu)化。
![]()
在抗 PD-1 抗體重鏈的ProteinMPNN 序列設計工作流程中的GYDE平臺核心界面
![]()
GYDE 平臺可實現(xiàn)從頭生成結合蛋白
行業(yè)意義
當前,蛋白質科學領域正經(jīng)歷快速發(fā)展,在這些技術進步中,GYDE 平臺的獨特價值在于其開源和協(xié)作特性,與商業(yè)解決方案不同,GYDE 是免費提供給學術界和工業(yè)界的科學家使用的,他們可以根據(jù)自己的需求構建定制的藥物發(fā)現(xiàn)分析平臺。這種開放性有助于促進更廣泛的科學社區(qū)協(xié)作,加速科學進步的步伐。
GYDE 平臺已經(jīng)在其內(nèi)部部署中集成了超過 20 種不同的計算工具,包括 AlphaFold、Boltz、Chai、ProteinMPNN、RFdiffusion 等主流 AI 模型,用戶可以通過簡單的點擊操作調用這些工具,無需擔心安裝配置和環(huán)境兼容性問題。此外,該平臺的數(shù)據(jù)共享功能尤其值得關注——研究人員可以通過一個簡單的超鏈接與全球同行分享完整的分析會話,包括所有數(shù)據(jù)、可視化結果和計算參數(shù)。這種級別的協(xié)作便利性在傳統(tǒng)科研工作流程中是難以實現(xiàn)的。
隨著 AI 在藥物發(fā)現(xiàn)中的應用日益深入,像 GYDE 這樣的平臺可能會成為未來科研基礎設施的重要組成部分。它不僅降低了技術門檻,更重要的是,它改變了科學家的工作方式——從孤立的工具使用轉向集成的、協(xié)作的研究范式。
論文鏈接:
https://www.biorxiv.org/content/10.64898/2026.03.24.714039v1
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.