如果有一天,AI 不僅能寫代碼、做分析,還能從過去幾十年的真實生物實驗中主動找出能讓身體“變年輕”的方法,會是怎樣的景象?
我們身體里有一個“時鐘”,隨著年齡的增長,這個時鐘會記錄我們身體的衰老程度。科學家們發現,通過分析大量的生物數據,能夠找到相關方法來“調慢”甚至讓這個時鐘“倒退”,以實現延緩衰老。
近期,一支來自美國哈佛大學和美國斯坦福大學等聯合團隊真的做到了——他們集成 40 余種衰老時鐘模型開發了一個名為 ClockBase Agent 的平臺,讓 AI 在 200 萬份人類和小鼠的分子組學數據里“挖寶”,并找出了超過 500 種可能讓生物年齡倒退的干預措施。
“這是首次從生物衰老線索的角度,系統性分析過去數十年產生的海量分子組學數據,意味著我們的平臺能夠重新利用已有的真實動物實驗數據,幫助藥企和醫學研究領域節省在細胞實驗上的數十億美元研究投入和數百萬樣本,進而加速推動整個流程。”應可鈞對 DeepTech 表示。
他是美國哈佛大學博士畢業生,目前在斯坦福大學托尼·維斯-科雷(Tony Wyss-Coray)實驗室和美國華盛頓大學大衛·貝克(David Baker)實驗室擔任博士后研究員,也是這項研究的第一作者兼共同通訊作者。
![]()
圖丨應可鈞(來源:應可鈞)
值得關注的是,基于該平臺新發現了一種抗衰老化合物 Ouabain,為開發延長健康壽命的干預策略奠定了基礎。實驗結果顯示,Ouabain 顯著延緩了老年小鼠的虛弱進程,不僅改善了其心臟功能還減輕了神經炎癥。
![]()
(來源:bioRxiv)
ClockBase Agent 的意義不僅限于衰老研究:
首先,這一研究范式改變了以往依賴預設假說和手動分析的模式,將過去數十年積累、原本用于其他研究目標的海量分子數據,轉變為一個強大的衰老干預措施“發現引擎”。并且,顯著降低了衰老生物標志物分析的門檻,使全球研究者均可基于數百萬樣本快速驗證假設,極大提高了科學數據的再利用價值。
其次,該方法具有可遷移性,可將系統中的衰老時鐘換成任何分子層面的生物標志物,從而以極低成本發現能夠影響疾病相關分子指標的干預措施,例如癌癥、免疫學、神經科學和代謝疾病等。
從“手動挖掘”到“自主智能”的范式革命
衰老是慢性疾病和死亡的首要風險因素,但長期以來,系統性識別能夠改變衰老軌跡的干預措施面臨挑戰。過去幾十年,盡管該領域積累了海量分子數據,但最大的局限性在于,相關研究的時間和研發成本都非常高,因此衰老相關論文多數是在小范圍內,由領域專家挖掘過去某個細分方向的數據集。
![]()
圖丨 ClockBase Agent 平臺架構與工作流(來源:bioRxiv)
ClockBase Agent 平臺能夠自主生成解析數據和假說、執行統計分析、進行文獻綜述,并自動生成科學報告,為研究人員提供有潛力且可靠的衰老干預措施。在嚴格專家驗證下,分析準確率達 99%。
其主要由以下三個核心 Agent 構成:
·Coding Agent:主要功能是寫代碼。通過代碼探索數據的分布來理解數據,進而設計并提供統計分析結果。
·Reviewer Agent:從樣本量、實驗模式生物、整個實驗的設置等多個維度對實驗質量進行評估,并基于對衰老模型的適用程度給實驗打分。
·Report Agent:通過整合 Coding Agent 和 Reviewer Agent 的結果,生成人類可讀性高的科學報告。
與此同時,研究團隊還整理了一個包含近年來數千篇衰老領域的論文數據集,構建了迄今為止最全面的生物年齡圖譜。并且,Reviewer Agent 和 Coding Agent 可隨時訪問該數據集,來尋找支撐相關理論或判斷的參考文獻。
![]()
圖丨基于人類與小鼠分子特征的綜合生物年齡圖譜(來源:bioRxiv)
盡管目前已有不少 AI 驅動藥物發現方面的研究,但一個不容忽視的問題是:其通常基于藥物與靶點的相互作用,在強假設基礎上構建數學模型,來預測可能具有抗衰老作用的藥物。
而這項研究與傳統范式最大的區別是,研究人員使用的數據大部分來自體內(in vivo)小鼠實驗。這意味著該平臺的篩選結果基于真實的實驗數據,即有科學家將相關藥物用于小鼠實驗,具有真實的測試效果和分子數據。
應可鈞進一步說道:“我們發現,通過這些分子數據預測樣本的衰老藥物確實能夠減少動物的衰老狀態或生物學年齡。所以,我們的結果相對于純計算和僅靠 AI 推導出來的結果更可靠。”
![]()
圖丨AI 智能體操作工作流與多維評分系統(來源:bioRxiv)
ClockBase Agent 平臺分析了來自 13,211 項小鼠 RNA 測序研究的 43,529 份干預對照比較,涵蓋了遺傳擾動、藥物治療、環境暴露和疾病模型等多種類型。為了驗證 AI 發現的可靠性,研究團隊還將高置信度的干預措施與權威的長壽基因和藥物數據庫進行比對。
結果顯示,在匹配的條目中,方向一致性具有統計學顯著性,進一步證實了 AI 智能體分析結果的生物學合理性。該平臺綜合篩選出有潛力的衰老候選藥物包括:Ouabain、KMO 抑制劑、降脂藥非諾貝特等。
突破數據孤島:AI 智能體如何攻克實驗數據理解難題
該研究的合作單位超過 20 家,包括斯坦福大學、哈佛大學、華盛頓大學等高校,以及基因泰克和英矽智能等公司。該研究始于 2022 年,研究團隊旨在將人類收集到的海量組學數據,都用衰老的形式進行分析。
彼時,大語言模型開始逐漸爆發,他們在研究初期最大的瓶頸是來自不同實驗室的數據。最初使用的是傳統生物信息學的方式,但在實際操作過程中,由于實驗設計的復雜性,研究人員很快發現,依靠自然語言處理方法很難精準識別對照組和實驗組的相關樣本。
甚至有些情況下,如果實驗中使用的小鼠都是同年齡或同性別,這些信息可能根本不會標注在數據文件里,而是直接放在論文或摘要中。如果 AI 不能閱讀或理解實驗設計,就無法提取這些信息。
![]()
(來源:bioRxiv)
研究團隊也嘗試過用大模型來標準化這些數據,但由于數據量過多很容易超出大模型的上下文容量。直到 2024 年,研究人員意識到可以用 AI 智能體來做這項研究。其優勢在于,它像人類科學家一樣能夠通過交互式的方式探索數據。比如,AI 智能體會先查看數據的前幾列,根據初步結果判斷數據的結構,然后再編寫代碼去驗證它對數據的假設是否正確,再繼續分析。
最終,相關論文以《自主 AI 智能體從數百萬分子檔案中發現抗衰老干預措施》(Autonomous AI Agents Discover Aging Interventions from Millions of Molecular Profiles)為題發表在預印本網站 bioRxiv[1]。據悉,所有數據與分析結果已在 www.clockbase.org 公開。
斯坦福大學博士后研究員應可鈞是第一作者兼共同通訊作者,哈佛醫學院亞歷山大?泰什科夫斯基(Alexander Tyshkovskiy)博士、加拿大麥吉爾大學博士生阿利別克?莫爾達科扎耶夫(Alibek Moldakozhayev)以及斯坦福大學和基因泰克公司博士后研究員王瀚宸是共同第一作者,布萊根婦女醫院與哈佛醫學院瓦迪姆·N·格拉迪舍夫(Vadim N. Gladyshev)教授擔任共同通訊作者。
![]()
圖丨相關論文(來源:bioRxiv)
“AI 智能體+多組學數據”的范式不僅為篩選衰老藥物提供了一種快速、可靠且無偏見的手段,還為傳統假設驅動的研究提供了良好的補充方案。通過這種全面的、基于數據的篩選,有望在不同領域的孤島之間架起一座橋梁,進而發現更多隱藏在整個科學歷史數據中的“珠寶”——那些通常被遺漏的、非傳統已知卻很有潛在價值的抗衰藥物。
在未來的研究階段中,研究團隊希望繼續篩選出排名前 50 的潛在抗衰老藥物。無論是遺傳學還是藥理學的干預措施,他們都計劃通過在實驗中重復驗證,來確認其中真正可逆轉衰老的藥物。
此外,他們將平臺篩選的藥物與美國食品藥品監督管理局(FDA)批準藥物進行重疊分析,并發現篩選出的抗衰老藥物中,有一部分已獲得 FDA 批準。“如果這些藥物在動物實驗中重復驗證有效,它們有望作為一種適合某種適應癥的、逆轉衰老的藥物被使用。”應可鈞表示。
95 后科學家的下一步:用蛋白質設計“重寫”衰老密碼
應可鈞是一名 95 后,他本科畢業于中山大學,碩士和博士均畢業于哈佛大學,博士導師為瓦迪姆·格拉迪舍夫(Vadim Gladyshev)教授。目前他在斯坦福托尼·維斯-科雷(Tony Wyss-Coray)實驗室和華盛頓大學大衛·貝克(David Baker)實驗室從事博士后研究工作。
他的研究融合了衰老生物學和蛋白質設計,旨在解決神經退行性疾病,重點關注衰老的原因、表觀遺傳學、代謝和多組學。
![]()
圖丨應可鈞與導師大衛·貝克(David Baker)教授(來源:應可鈞)
據應可鈞透露,他在本科期間就確定了衰老的研究方向,并去了七八個不同的實驗室學習和體驗。他發現,每個實驗室都在做衰老的某個細分方向,并且他們都有一個非常強的假設——某個通路或小分子至關重要。
“去過不同的實驗室了解和體驗后,我有一個初步的想法:衰老可能是一個系統性的問題,它可能不是某個通路或某個生物學現象主導的機制。”應可鈞說。后來他與博士導師瓦迪姆·格拉迪舍夫教授交流時,二人的想法“不謀而合”,他們都認為衰老是隨著年齡產生的各種損傷累積的體現。
博士期間,他與所在團隊以封面論文的形式在 Nature Aging 報道了首個基于因果推斷的衰老時鐘 [3]。此外,他還開發了首批 DNA 甲基化組基礎模型之一 MethylGPT[4]。
![]()
圖丨 Nature Aging 當期封面(來源:Nature Aging)
隨著研究的深入,應可鈞意識到現階段衰老領域的主要問題并不是沒有更好的篩選手段,而是沒有更好的干預措施。“無論是藥物干預還是基因干預,干預尺度都太小了。它們要么只針對一個通路,要么只針對一個基因,很難對系統性的衰老癥狀進行全面干預。”他說。
跨物種的相關研究為應可鈞帶來很大啟發:到目前為止,科學家還沒有找到任何干預措施能夠超過小鼠 20% 的壽命提升,但自然界卻可以非常輕松地實現 100 倍以上的壽命差異。
因此,最大的差異在于它們的基因調控和蛋白本身的序列。現在,人們已經可以通過基因療法過表達/敲除基因,或用藥物降低或升高蛋白的活性來解決基因調控相關問題,但是對蛋白序列本身的優化還極為有限。
應可鈞認為,要解決衰老這種復雜的生物學問題需要突破基因療法的單一維度。“更根本的方式可能是重新設計或部分重新設計這些蛋白,讓它們不僅能調控已有蛋白質的功能,還能實現新的生物學功能或整合新的生物學通路,以更好地支持更長的壽命或干預其他疾病。”
基于此,他正在利用機器學習和蛋白質設計開發下一代療法。據了解,應可鈞正在尋找教職工作,并計劃在 2026 年成為獨立 PI,繼續該方向的深入研究。
參考資料:
1.https://www.biorxiv.org/content/10.1101/2023.02.28.530532v2
2.ClockBase Agent 平臺 www.clockbase.org
3.https://www.nature.com/articles/s43587-023-00557-0
4.https://www.biorxiv.org/content/10.1101/2024.10.30.621013v2
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.