![]()
谷歌發(fā)布基于Gemma家族、270億參數(shù)的生物學(xué)基礎(chǔ)模型Cell2Sentence-Scale,它成功預(yù)測并經(jīng)實(shí)驗(yàn)驗(yàn)證了一條潛在的癌癥免疫療法新通路,劈柴哥說這標(biāo)志著AI在科學(xué)發(fā)現(xiàn)中的一個(gè)里程碑
![]()
就在今天,谷歌DeepMind與耶魯大學(xué)宣布,正式推出一個(gè)專為單細(xì)胞分析設(shè)計(jì)的270億參數(shù)新基礎(chǔ)模型,該模型名為Cell2Sentence Scale 27B(簡稱C2S-Scale),構(gòu)建于Gemma開源模型家族之上
C2S-Scale成功生成了一個(gè)關(guān)于癌細(xì)胞行為的全新假說,并且這一假說已在活細(xì)胞實(shí)驗(yàn)中得到驗(yàn)證。這一發(fā)現(xiàn)揭示了一條頗具前景的新路徑,有望用于開發(fā)對抗癌癥的新療法。
此項(xiàng)工作建立在谷歌今年早些時(shí)候的研究之上,當(dāng)時(shí)他們證明了生物學(xué)模型也遵循明確的“縮放定律”(scaling laws)——就像自然語言一樣,更大的模型在生物學(xué)任務(wù)上表現(xiàn)更好。
但這引出了一個(gè)關(guān)鍵問題:更大的模型僅僅是把現(xiàn)有任務(wù)做得更好,還是能夠獲得全新的能力?
這次的成果給出了答案:規(guī)模化的真正潛力在于創(chuàng)造新想法和發(fā)現(xiàn)未知
C2S-Scale 27B如何工作
癌癥免疫療法面臨的一大挑戰(zhàn)是,許多腫瘤對人體免疫系統(tǒng)來說是“冷”的——即無法被免疫系統(tǒng)識別。而關(guān)鍵策略之一,就是通過一個(gè)叫做抗原呈遞(antigen presentation)的過程,迫使這些“冷”腫瘤展示能觸發(fā)免疫反應(yīng)的信號,從而變“熱”
研究團(tuán)隊(duì)給C2S-Scale 27B模型布置了一項(xiàng)任務(wù):尋找一種能充當(dāng)“條件性放大器”的藥物。
具體來說,這種藥物只有在特定免疫環(huán)境陽性的條件下才能增強(qiáng)免疫信號。在這種環(huán)境中,已經(jīng)存在低水平的關(guān)鍵免疫信號蛋白——干擾素,但其水平不足以自行誘導(dǎo)抗原呈遞。
這種任務(wù)需要模型具備高水平的條件性推理能力,而這似乎是模型規(guī)模擴(kuò)大后才涌現(xiàn)出的能力。團(tuán)隊(duì)之前使用的小規(guī)模模型無法解決這種依賴于特定上下文的效應(yīng)。
為了實(shí)現(xiàn)這一目標(biāo),研究人員設(shè)計(jì)了一個(gè)雙重上下文虛擬篩選方案,分兩個(gè)階段進(jìn)行:
1.免疫環(huán)境-陽性 (Immune-Context-Positive): 向模型提供來自真實(shí)患者的樣本數(shù)據(jù),這些樣本保留了完整的腫瘤-免疫細(xì)胞相互作用和低水平的干擾素信號
2.免疫環(huán)境-中性 (Immune-Context-Neutral): 向模型提供孤立的細(xì)胞系數(shù)據(jù),其中不包含任何免疫環(huán)境信息
隨后,團(tuán)隊(duì)模擬了超過4000種藥物在這兩種不同環(huán)境下的效果,并要求模型預(yù)測:哪些藥物僅僅在第一種陽性環(huán)境下才能促進(jìn)抗原呈遞。
這樣做旨在將篩選偏向于與患者真實(shí)情況更相關(guān)的場景。在模型篩選出的眾多候選藥物中,一部分(約10-30%)在現(xiàn)有文獻(xiàn)中已有記載,而其余的則是完全出人意料的發(fā)現(xiàn),此前從未被報(bào)道過與此相關(guān)
AI預(yù)測到實(shí)驗(yàn)室驗(yàn)證
模型的預(yù)測結(jié)果非常清晰
它發(fā)現(xiàn)了一種名為silmitasertib (CX-4945)的激酶CK2抑制劑,表現(xiàn)出驚人的“上下文分裂”效應(yīng)。模型預(yù)測,當(dāng)silmitasertib應(yīng)用于免疫環(huán)境-陽性設(shè)定時(shí),抗原呈遞會顯著增強(qiáng);而在免疫環(huán)境-中性設(shè)定中,則幾乎沒有效果。
這個(gè)預(yù)測之所以令人亢奮,是因?yàn)樗男路f性。盡管CK2被認(rèn)為與多種細(xì)胞功能(包括免疫調(diào)節(jié))有關(guān),但此前沒有任何文獻(xiàn)報(bào)道過通過silmitasertib抑制CK2能明確增強(qiáng)MHC-I表達(dá)或抗原呈遞
這表明,模型正在生成一個(gè)全新的、可供檢驗(yàn)的科學(xué)假說,而不僅僅是復(fù)述已知事實(shí)
當(dāng)然,一個(gè)預(yù)測只有在臨床應(yīng)用中得到驗(yàn)證才有價(jià)值。真正的考驗(yàn)首先來自實(shí)驗(yàn)室
在項(xiàng)目的下一階段,團(tuán)隊(duì)將這個(gè)假說帶到了實(shí)驗(yàn)臺上,在人類神經(jīng)內(nèi)分泌細(xì)胞模型中進(jìn)行測試——這是一種模型在訓(xùn)練期間完全沒有見過的細(xì)胞類型
實(shí)驗(yàn)結(jié)果證明:
單獨(dú)使用silmitasertib處理細(xì)胞,對抗原呈遞(MHC-I)沒有影響
單獨(dú)使用低劑量干擾素處理細(xì)胞,效果有限
同時(shí)使用silmitasertib和低劑量干擾素處理細(xì)胞,則產(chǎn)生了顯著的協(xié)同放大效應(yīng)
值得注意的是,在實(shí)驗(yàn)室測試中,silmitasertib和低劑量干擾素的組合使用,使得抗原呈遞增加了約50%。這將使腫瘤對免疫系統(tǒng)來說變得更加可見。
模型的預(yù)測,在體外實(shí)驗(yàn)中得到了多次證實(shí)。C2S-Scale成功識別出一種新穎的、干擾素條件下的放大器,揭示了將“冷”腫瘤變“熱”的潛在新通路,有望讓腫瘤對免疫療法更敏感
AI驅(qū)動生物學(xué)
這一成果不僅為開發(fā)使用多種藥物協(xié)同作用的組合療法提供了強(qiáng)有力的、經(jīng)實(shí)驗(yàn)驗(yàn)證的線索,也為一種新型的生物學(xué)發(fā)現(xiàn)模式提供了藍(lán)圖。
它證明了,通過遵循縮放定律并構(gòu)建像C2S-Scale 27B這樣的大型模型,我們可以創(chuàng)建出足夠強(qiáng)大的細(xì)胞行為預(yù)測模型,用于進(jìn)行高通量虛擬篩選、發(fā)現(xiàn)依賴于特定條件的生物學(xué)現(xiàn)象,并生成有生物學(xué)依據(jù)的假說。
目前,耶魯大學(xué)的團(tuán)隊(duì)正在進(jìn)一步探索這一新發(fā)現(xiàn)的機(jī)制,并在其他免疫環(huán)境中測試更多由AI生成的預(yù)測。通過進(jìn)一步的臨床前和臨床驗(yàn)證,這些假說最終可能加速新療法的開發(fā)進(jìn)程。
上手C2S-Scale 27B
新的C2S-Scale 27B模型及其相關(guān)資源現(xiàn)已向研究社區(qū)開放。
預(yù)印本paper:
https://www.biorxiv.org/content/10.1101/2025.04.14.648850v2
在Hugging Face模型和資源:
https://huggingface.co/vandijklab/C2S-Scale-Gemma-2-27B
在GitHub代碼:
https://github.com/vandijklab/cell2sentence
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.