網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI Biotech第一股，深度拆解（平臺(tái)篇）

2025-12-31 21:19:56　來(lái)源: 瞪羚社

廣東舉報(bào)

分享至

上方「瞪羚社」即刻關(guān)注并加入社群

聚焦高成長(zhǎng)公司，100000+投資菁英共同關(guān)注

英矽智能在經(jīng)歷了九九八十一難之后總算上市，這家biotech可以說(shuō)是在AI制藥領(lǐng)域最為出名的藥企，如今它的上市，大家對(duì)它的估值更是做出了非常多的聯(lián)想，也有很多人對(duì)它展開了星辰大海的期待。

筆者作為一名研究創(chuàng)新藥的寫手，可能對(duì)于一家AI相關(guān)的企業(yè)不太會(huì)拍估值，因此只求認(rèn)真梳理清楚該藥企平臺(tái)情況和管線價(jià)值，以此希望給投資者一個(gè)基本的研究指南。本篇文章，筆者將以深入淺出的筆法講解英矽智能的壓箱底技術(shù)——PHARMA.AI平臺(tái)。

chemistry42平臺(tái)

英矽智能平臺(tái)主要就是PHARMA.AI平臺(tái)，Pharma.AI平臺(tái)由Biology42，Chemistry42，Medicine42及Science42組成，旨在整合藥物發(fā)現(xiàn)及開發(fā)過(guò)程,以識(shí)別新藥靶點(diǎn)，針對(duì)新品種及已知靶點(diǎn)設(shè)計(jì)替代分子,優(yōu)化臨床開發(fā),并通過(guò)多代理生成式人工智能協(xié)助加強(qiáng)研究。此外，該平臺(tái)由強(qiáng)大的data warehouse（數(shù)據(jù)倉(cāng)庫(kù)）支持，可自動(dòng)執(zhí)行數(shù)據(jù)獲取和處理，確保跨應(yīng)用程序的無(wú)縫集成和可擴(kuò)展性。

一個(gè)一個(gè)來(lái)拆，chemistry42是一個(gè)生成小分子的平臺(tái)。它將最先進(jìn)的生成式人工智能算法與藥物化學(xué)和計(jì)算化學(xué)領(lǐng)域的專業(yè)知識(shí)以及最佳工程實(shí)踐相結(jié)合。該平臺(tái)于2020年推出，已被20多家制藥公司、15個(gè)外部項(xiàng)目和30多個(gè)內(nèi)部項(xiàng)目采用。該平臺(tái)的主要目標(biāo)是加速設(shè)計(jì)具有用戶自定義特性的新型分子，其一般工作流程如圖所示并進(jìn)行了描述。

大概的總做流程如下圖所示，第一步，用戶在公司專屬的安全軟件中上傳數(shù)據(jù)，并配置平臺(tái)以設(shè)置生成結(jié)構(gòu)的所需屬性。第二步，運(yùn)行平臺(tái)，其中40多個(gè)生成模型一起運(yùn)行以生成新的結(jié)構(gòu)——此步驟稱為生成階段。在生成階段，各種過(guò)濾器會(huì)對(duì)生成的分子結(jié)構(gòu)進(jìn)行篩選。然后，這些分子結(jié)構(gòu)會(huì)經(jīng)過(guò)多組獎(jiǎng)勵(lì)和評(píng)分模塊（分為2D模塊和3D模塊）的評(píng)估，這些模塊會(huì)根據(jù)預(yù)定義的標(biāo)準(zhǔn)動(dòng)態(tài)評(píng)估生成結(jié)構(gòu)的屬性。此外，還可以將自定義評(píng)分模塊（例如 ADME預(yù)測(cè)器）集成到獎(jiǎng)勵(lì)流程中，以對(duì)生成的結(jié)構(gòu)進(jìn)行優(yōu)先級(jí)排序。這些模塊構(gòu)成了 Chemistry42基于多智能體強(qiáng)化學(xué)習(xí) (RL) 的生成協(xié)議的核心。生成的結(jié)構(gòu)得分會(huì)被反饋給生成模型，以增強(qiáng)模型性能并引導(dǎo)生成過(guò)程朝著高分結(jié)構(gòu)發(fā)展——這被稱為學(xué)習(xí)階段。最后一步是分析。生成的結(jié)構(gòu)會(huì)根據(jù)其預(yù)測(cè)屬性（包括合成可及性、新穎性、多樣性等）以及可自定義的指標(biāo)進(jìn)行自動(dòng)排序。該平臺(tái)還為用戶提供交互式工具來(lái)監(jiān)控生成模型的性能。

chemistry42可以基于兩種模式生成分子：LBDD（基于配體的模式）以及SBDD（基于結(jié)構(gòu)的模式），基于配體的藥物設(shè)計(jì)（LBDD）方法需要輸入二維或三維配體結(jié)構(gòu)，格式可以是.sdf文件、SMILES字符串，或者用戶也可以使用便捷的繪圖面板直接在平臺(tái)上繪制分子草圖。此外，用戶還可以根據(jù)需要添加藥效團(tuán)假設(shè)，并可使用小部件手動(dòng)創(chuàng)建，或由平臺(tái)自動(dòng)生成。在基于結(jié)構(gòu)的藥物設(shè)計(jì)(SBDD)方法中，必須將蛋白質(zhì)靶點(diǎn)的結(jié)構(gòu)（無(wú)論是無(wú)配體形式還是與配體結(jié)合的形式）以.pdb文件的形式上傳到平臺(tái)。用戶可以選擇配體周圍的口袋（配體結(jié)合位點(diǎn)），也可以從口袋掃描模塊提供的備選口袋集中選擇一個(gè)。與LBDD的情況類似，也可以根據(jù)需要添加藥效團(tuán)假說(shuō)。

Chemistry42中用于基于強(qiáng)化學(xué)習(xí)的生成的獎(jiǎng)勵(lì)和評(píng)分模塊是二維或三維的。上圖中的二維模塊由多個(gè)評(píng)分和內(nèi)部開發(fā)的藥物化學(xué)過(guò)濾器（MCF）組成，用于評(píng)估生成的結(jié)構(gòu)。在當(dāng)前版本的Chemistry42中，MCF包含一套超過(guò)460條基于結(jié)構(gòu)的內(nèi)部規(guī)則，用于排除“不良”結(jié)構(gòu)。在利用二維模塊評(píng)估生成的結(jié)構(gòu)之后，將部署多個(gè)三維模塊進(jìn)行進(jìn)一步評(píng)估。這里我們對(duì)三維模塊的評(píng)估不再贅述，大概就是使得能量最小化，以及柔性評(píng)估等等。

這里舉一個(gè)例子，GENTRL 模型和后生成協(xié)議是Chemistry42平臺(tái)當(dāng)前架構(gòu)的雛形。2018 年開發(fā)的模型生成了經(jīng)實(shí)驗(yàn)驗(yàn)證的高效DDR1激酶抑制劑。GENTRL模型首先基于ZINC 數(shù)據(jù)集進(jìn)行訓(xùn)練，然后利用已報(bào)道的DDR1抑制劑和一個(gè)公開的激酶抑制劑數(shù)據(jù)集進(jìn)行微調(diào)。隨后，對(duì)獲得的結(jié)構(gòu)進(jìn)行結(jié)構(gòu)過(guò)濾，以去除含有反應(yīng)性基團(tuán)等其他警示信號(hào)的結(jié)構(gòu)。

經(jīng)過(guò)一系列篩選后，剩余的結(jié)構(gòu)隨機(jī)選擇40個(gè)進(jìn)行人工合成可行性評(píng)估。在這40個(gè)結(jié)構(gòu)中，有6個(gè)被選中進(jìn)行合成和生物學(xué)評(píng)估。到第35天，這些化合物已成功合成，并在體外進(jìn)行了DDR1酶促激酶抑制活性測(cè)試。超過(guò)一半的化合物被發(fā)現(xiàn)具有活性（IC 50 < 1μM），其中包括兩種兩位數(shù)納摩爾級(jí)別的抑制劑（10 nM和21 nM）。基于此，該DDR1激酶抑制劑最后進(jìn)入濕實(shí)驗(yàn)篩選階段。用Chemistry42的雛形模型，大大提高了前期化合物的篩選效率。

Biology42平臺(tái)

然后是Biology42平臺(tái)，該平臺(tái)也由多個(gè)應(yīng)用程序組成，Pandaomics，Generative Biologics、Life Star 2，Precious1GPT、Precious2 GPT和Precious3 GPT。如果說(shuō)chemistry42主要是對(duì)小分子進(jìn)行生成和篩選的話，那么Biology42就主要是對(duì)大分子蛋白質(zhì)進(jìn)行評(píng)估以及預(yù)測(cè)其相互作用。

這里我們主要介紹Pandaomics，PandaOmics提供了一個(gè)全面的數(shù)據(jù)處理流程，有助于識(shí)別潛在的治療靶點(diǎn)和生物標(biāo)志物。其數(shù)據(jù)處理的流程如下圖所示：1.進(jìn)行數(shù)據(jù)集選擇 2.和樣本組比較3.提供基因和通路水平的分析4.對(duì)分子特征與臨床數(shù)據(jù)之間的相關(guān)性進(jìn)行探索。該平臺(tái)將這些步驟的結(jié)果整合到薈萃分析中5.利用包括從文本數(shù)據(jù)中提取的先驗(yàn)知識(shí)在內(nèi)的多種數(shù)據(jù)源來(lái)增強(qiáng)靶點(diǎn)預(yù)測(cè)6.識(shí)別治療靶點(diǎn)和生物標(biāo)志物 7.疾病相關(guān)活性化合物鑒定。8.適應(yīng)癥優(yōu)先級(jí)排序9生物知識(shí)圖譜分析10.基于大型語(yǔ)言模型的ChatPandaGPT來(lái)解釋基因-疾病關(guān)聯(lián)。11.用于靶點(diǎn)驗(yàn)證和化合物篩選的機(jī)器人實(shí)驗(yàn)室與平臺(tái)的AI核心形成反饋回路12.利用 PandaOmics確定的目標(biāo)假設(shè)輸入Chemistry42軟件，進(jìn)行小分子生成。

在最近的2023年案例研究中，PandaOmics發(fā)現(xiàn)了CAMMK2、MARCKS和p62，它們?cè)诎柎暮Ｄ〖?xì)胞模型中得到了成功驗(yàn)證；KDM1A被證實(shí)是一種雙重衰老/腫瘤靶點(diǎn)，可以延長(zhǎng)秀麗隱桿線蟲的壽命。這些案例研究也突顯了PandaOmics和iPANDA能夠研究的疾病和生物學(xué)機(jī)制的多樣性。該平臺(tái)已被應(yīng)用于研究DNA修復(fù)障礙、腎臟上皮細(xì)胞命運(yùn)特化以及人類肌肉衰老等多種疾病。

除此之外，biology42平臺(tái)還有值得關(guān)注的程序是Generative Biologics。該平臺(tái)于2024年7月被推出，它能設(shè)計(jì)并優(yōu)化多類生物藥物一包括多肽,納米抗體及全長(zhǎng)抗體一精確地針對(duì)特定點(diǎn)進(jìn)行高親和力結(jié)合,利用我們的生成式人工智能模型及勵(lì)函數(shù),平臺(tái)能設(shè)計(jì)全新生物藥物,不僅顯示優(yōu)異的結(jié)合親和力,但亦滿足關(guān)鍵的可開發(fā)性標(biāo)準(zhǔn),如穩(wěn)定性,溶解性與可制造性。Generative Biologics能僅以三個(gè)步驟生成新的生物藥物分子。其模組化架構(gòu)支持反復(fù)優(yōu)化，使用戶通過(guò)由人工智能預(yù)測(cè)指導(dǎo)的反鎖過(guò)路以優(yōu)化生物候選藥物.這精簡(jiǎn)設(shè)計(jì)流程,并顯著降低傳統(tǒng)生物藥物開發(fā)相關(guān)的時(shí)間和成本。

英矽智能于2022年12月在中國(guó)蘇州推出建筑面積為1,665平方米的原有Life star自動(dòng)化實(shí)驗(yàn)室。于2025年，我們將實(shí)驗(yàn)室搬遷至上海并升級(jí)至下一代自動(dòng)化實(shí)驗(yàn)室Life Star 2。該自動(dòng)化實(shí)驗(yàn)室配備了包括新一代測(cè)序儀,細(xì)胞培養(yǎng)器,細(xì)胞分析儀,自動(dòng)化液體處理機(jī),回聲液體處理器,成像系統(tǒng),高內(nèi)涵分析平臺(tái)及自動(dòng)導(dǎo)向車(AGV)的全面儀器。其旨在進(jìn)一步提高我們內(nèi)部的實(shí)驗(yàn)室實(shí)驗(yàn)的效率及能力，并促進(jìn)數(shù)據(jù)生成以改善我們的Pharma.AI平臺(tái)。

與早期的自動(dòng)化實(shí)驗(yàn)室相比,Life Star 2亦致力于決策流程中減少人為干預(yù)。生成式人工智能賦能Life Star 2能自動(dòng)化點(diǎn)選擇，設(shè)計(jì)實(shí)驗(yàn)及執(zhí)行實(shí)驗(yàn)以收集實(shí)驗(yàn)數(shù)據(jù)，以產(chǎn)生及測(cè)試疾病假設(shè)，并進(jìn)一步驗(yàn)證及訓(xùn)練人工智能模型。自動(dòng)化實(shí)驗(yàn)室消除了人工靶點(diǎn)選擇的偏見(jiàn)，并為發(fā)現(xiàn)新藥和治療挖掘了力。英矽智能將繼續(xù)努力優(yōu)化Life Star 2的設(shè)計(jì),以擴(kuò)大其能力范圍，縮小其占地面積并優(yōu)化其建設(shè)及營(yíng)運(yùn)成本。

除此之外，Life Star2的模塊化能逐步引入新的藥物發(fā)現(xiàn)方法等新功能。此舉將增強(qiáng)英矽智能的內(nèi)部開發(fā)能力,同時(shí)促進(jìn)其接受及采用.同時(shí),實(shí)驗(yàn)室的模塊化設(shè)計(jì)方案使我們能代優(yōu)化并提升其成本效益,并為全球研究機(jī)構(gòu)提供具吸引力的一攬子解決方案.此外,由于每個(gè)生命之星都將在現(xiàn)場(chǎng)配備完整的硬件及軟件解決方案，所有受試者數(shù)據(jù)的處理均可在現(xiàn)場(chǎng)完成，從而降低數(shù)據(jù)隱私風(fēng)險(xiǎn)。

medicine42平臺(tái)

如果現(xiàn)在還覺(jué)得英矽智能只能做前期的小分子藥物設(shè)計(jì)及蛋白質(zhì)靶點(diǎn)預(yù)測(cè)，那就大錯(cuò)特錯(cuò)了，事實(shí)上，它的medicine42平臺(tái)可以預(yù)測(cè)臨床試驗(yàn)結(jié)果。該平臺(tái)由inClinico應(yīng)用程序組成，inClinico為一種多引擎，生成式人工智能臨床試驗(yàn)分析應(yīng)用程序，其旨在預(yù)測(cè)臨床試驗(yàn)的成功。

inClinico主要專注于在廣泛的治療適應(yīng)癥中成功進(jìn)行I期臨床試驗(yàn)的可能性，因?yàn)橛⑽悄苷J(rèn)為I期臨床通常是與受試者首個(gè)概念驗(yàn)證數(shù)據(jù)相關(guān)的主要拐點(diǎn)的關(guān)鍵階段。此外,通過(guò)仔細(xì)審查臨床試驗(yàn)設(shè)計(jì)的詳細(xì)資料，inClinico亦有助于識(shí)別臨床試驗(yàn)設(shè)計(jì)中的潛在弱項(xiàng),使臨床試驗(yàn)申辦者能作出相應(yīng)調(diào)整,從而可能增加其試驗(yàn)成功的概率.通過(guò)整合及分析各種數(shù)據(jù)來(lái)源，inClinico計(jì)算與試驗(yàn)成功有關(guān)的不同部分的評(píng)分,包括靶點(diǎn)選擇,藥物結(jié)構(gòu)，試驗(yàn)設(shè)計(jì)及受試者資格。該等評(píng)分將會(huì)綜合評(píng)估并納入預(yù)測(cè)臨床試驗(yàn)成功推進(jìn)至開發(fā)流程下一階段的概率中，具體而言，靶點(diǎn)選擇評(píng)分乃根據(jù)與PandaOmics的共享元素進(jìn)行評(píng)估，該等元素估計(jì)靶點(diǎn)與相關(guān)疾病的關(guān)聯(lián)以及在相關(guān)點(diǎn)的情況下疾病的異質(zhì)性。此外，藥物結(jié)構(gòu)評(píng)分是根據(jù)與生成化學(xué)的共享元素得出的，這些元素評(píng)估分子描述符的貢獻(xiàn)以及ADME(Adme)及毒性特征。

為了進(jìn)行內(nèi)部驗(yàn)證，英矽智能使用2021年之前臨床試驗(yàn)結(jié)果的公開數(shù)據(jù)對(duì)inClinico進(jìn)行訓(xùn)練,然后使用2021年1月至2021年9月期間讀取的不同治療領(lǐng)域的臨床試驗(yàn)結(jié)果對(duì)平臺(tái)進(jìn)行前瞻性驗(yàn)證。在該研究中，inClinico基于接收器操作特征(ROC)曲線下的面積(AUC)實(shí)現(xiàn)0.86的預(yù)測(cè)值，該曲線是診斷能力的一種指標(biāo),該數(shù)字越接近1，表明進(jìn)入預(yù)測(cè)進(jìn)入臨床II期的評(píng)估越準(zhǔn)確。于2019年,一家全球制藥公司委聘英矽智能應(yīng)用inClinico來(lái)預(yù)測(cè)該制藥公司選定的正在進(jìn)行的六項(xiàng)II期臨床試驗(yàn)中的七項(xiàng)結(jié)果，英矽智能部署了inClinico來(lái)估計(jì)成功的概率,并對(duì)該七項(xiàng)結(jié)果進(jìn)行特征分析。截至最后實(shí)際可行日期，全部七項(xiàng)臨床試驗(yàn)結(jié)果均已公布,而inClinico正確預(yù)測(cè)七項(xiàng)結(jié)果中的五項(xiàng)。

結(jié)語(yǔ)：這就是英矽智能目前平臺(tái)的實(shí)力，它現(xiàn)在已經(jīng)真正建成了在創(chuàng)新藥全鏈條覆蓋的人工智能體系，從對(duì)蛋白質(zhì)結(jié)構(gòu)及相互作用，靶點(diǎn)進(jìn)行分析的biology42，到能夠生成大量小分子并對(duì)化學(xué)分子進(jìn)行不斷篩選的chemistry42，到能夠預(yù)測(cè)臨床結(jié)果的medicine42。這些平臺(tái)構(gòu)成了目前英矽智能講故事的基石。

也正因?yàn)榇耍覀冃枰延⑽悄艿墓乐捣譃閮蓚€(gè)部分，一個(gè)部分是與其它藥企（例如石藥）的外包服務(wù)收入，這方面類似于CXO，另一部分是自身的管線估值，這方面直接按biotech進(jìn)行估值就好，

那么英矽智能具體的估值，管線價(jià)值，外包研發(fā)費(fèi)用，管線批量BD的估值怎么講呢？我們下半篇進(jìn)行拆解。

祝大家2026新年快樂(lè)、身體健康、工作順?biāo)欤兄x一直以來(lái)支持我們的讀者朋友。

喜歡我們文章的朋友點(diǎn)個(gè)“在看”以及給我們加“星標(biāo)”吧，不然微信推送規(guī)則改變，有可能每天都會(huì)錯(cuò)過(guò)我們哦~

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.