上方「瞪羚社」即刻關注并加入社群
聚焦高成長公司,100000+投資菁英共同關注
英矽智能在經歷了九九八十一難之后總算上市,這家biotech可以說是在AI制藥領域最為出名的藥企,如今它的上市,大家對它的估值更是做出了非常多的聯想,也有很多人對它展開了星辰大海的期待。
筆者作為一名研究創新藥的寫手,可能對于一家AI相關的企業不太會拍估值,因此只求認真梳理清楚該藥企平臺情況和管線價值,以此希望給投資者一個基本的研究指南。本篇文章,筆者將以深入淺出的筆法講解英矽智能的壓箱底技術——PHARMA.AI平臺。
01
chemistry42平臺
英矽智能平臺主要就是PHARMA.AI平臺,Pharma.AI平臺由Biology42,Chemistry42,Medicine42及Science42組成,旨在整合藥物發現及開發過程,以識別新藥靶點,針對新品種及已知靶點設計替代分子,優化臨床開發,并通過多代理生成式人工智能協助加強研究。此外,該平臺由強大的data warehouse(數據倉庫)支持,可自動執行數據獲取和處理,確保跨應用程序的無縫集成和可擴展性。
一個一個來拆,chemistry42是一個生成小分子的平臺。它將最先進的生成式人工智能算法與藥物化學和計算化學領域的專業知識以及最佳工程實踐相結合。該平臺于2020年推出,已被20多家制藥公司、15個外部項目和30多個內部項目采用。該平臺的主要目標是加速設計具有用戶自定義特性的新型分子,其一般工作流程如圖所示并進行了描述。
![]()
大概的總做流程如下圖所示,第一步,用戶在公司專屬的安全軟件中上傳數據,并配置平臺以設置生成結構的所需屬性。第二步,運行平臺,其中40多個生成模型一起運行以生成新的結構——此步驟稱為生成階段。在生成階段,各種過濾器會對生成的分子結構進行篩選。然后,這些分子結構會經過多組獎勵和評分模塊(分為2D模塊和3D模塊)的評估,這些模塊會根據預定義的標準動態評估生成結構的屬性。此外,還可以將自定義評分模塊(例如 ADME預測器)集成到獎勵流程中,以對生成的結構進行優先級排序。這些模塊構成了 Chemistry42基于多智能體強化學習 (RL) 的生成協議的核心。生成的結構得分會被反饋給生成模型,以增強模型性能并引導生成過程朝著高分結構發展——這被稱為學習階段。最后一步是分析。生成的結構會根據其預測屬性(包括合成可及性、新穎性、多樣性等)以及可自定義的指標進行自動排序。該平臺還為用戶提供交互式工具來監控生成模型的性能。
chemistry42可以基于兩種模式生成分子:LBDD(基于配體的模式)以及SBDD(基于結構的模式),基于配體的藥物設計(LBDD)方法需要輸入二維或三維配體結構,格式可以是.sdf文件、SMILES字符串,或者用戶也可以使用便捷的繪圖面板直接在平臺上繪制分子草圖。此外,用戶還可以根據需要添加藥效團假設,并可使用小部件手動創建,或由平臺自動生成。在基于結構的藥物設計(SBDD)方法中,必須將蛋白質靶點的結構(無論是無配體形式還是與配體結合的形式)以.pdb文件的形式上傳到平臺。用戶可以選擇配體周圍的口袋(配體結合位點),也可以從口袋掃描模塊提供的備選口袋集中選擇一個。與LBDD的情況類似,也可以根據需要添加藥效團假說。
Chemistry42中用于基于強化學習的生成的獎勵和評分模塊是二維或三維的。上圖中的二維模塊由多個評分和內部開發的藥物化學過濾器(MCF)組成,用于評估生成的結構。在當前版本的Chemistry42中,MCF包含一套超過460條基于結構的內部規則,用于排除“不良”結構。在利用二維模塊評估生成的結構之后,將部署多個三維模塊進行進一步評估。這里我們對三維模塊的評估不再贅述,大概就是使得能量最小化,以及柔性評估等等。
這里舉一個例子,GENTRL 模型和后生成協議是Chemistry42平臺當前架構的雛形。2018 年開發的模型生成了經實驗驗證的高效DDR1激酶抑制劑。GENTRL模型首先基于ZINC 數據集進行訓練,然后利用已報道的DDR1抑制劑和一個公開的激酶抑制劑數據集進行微調。隨后,對獲得的結構進行結構過濾,以去除含有反應性基團等其他警示信號的結構。
經過一系列篩選后,剩余的結構隨機選擇40個進行人工合成可行性評估。在這40個結構中,有6個被選中進行合成和生物學評估。到第35天,這些化合物已成功合成,并在體外進行了DDR1酶促激酶抑制活性測試。超過一半的化合物被發現具有活性(IC 50 < 1μM),其中包括兩種兩位數納摩爾級別的抑制劑(10 nM和21 nM)。基于此,該DDR1激酶抑制劑最后進入濕實驗篩選階段。用Chemistry42的雛形模型,大大提高了前期化合物的篩選效率。
02
Biology42平臺
然后是Biology42平臺,該平臺也由多個應用程序組成,Pandaomics,Generative Biologics、Life Star 2,Precious1GPT、Precious2 GPT和Precious3 GPT。如果說chemistry42主要是對小分子進行生成和篩選的話,那么Biology42就主要是對大分子蛋白質進行評估以及預測其相互作用。
這里我們主要介紹Pandaomics,PandaOmics提供了一個全面的數據處理流程,有助于識別潛在的治療靶點和生物標志物。其數據處理的流程如下圖所示:1.進行數據集選擇 2.和樣本組比較3.提供基因和通路水平的分析4.對分子特征與臨床數據之間的相關性進行探索。該平臺將這些步驟的結果整合到薈萃分析中5.利用包括從文本數據中提取的先驗知識在內的多種數據源來增強靶點預測6.識別治療靶點和生物標志物 7.疾病相關活性化合物鑒定。8.適應癥優先級排序9生物知識圖譜分析10.基于大型語言模型的ChatPandaGPT來解釋基因-疾病關聯。11.用于靶點驗證和化合物篩選的機器人實驗室與平臺的AI核心形成反饋回路12.利用 PandaOmics確定的目標假設輸入Chemistry42軟件,進行小分子生成。
![]()
在最近的2023年案例研究中,PandaOmics發現了CAMMK2、MARCKS和p62,它們在阿爾茨海默病細胞模型中得到了成功驗證;KDM1A被證實是一種雙重衰老/腫瘤靶點,可以延長秀麗隱桿線蟲的壽命。這些案例研究也突顯了PandaOmics和iPANDA能夠研究的疾病和生物學機制的多樣性。該平臺已被應用于研究DNA修復障礙、腎臟上皮細胞命運特化以及人類肌肉衰老等多種疾病。
除此之外,biology42平臺還有值得關注的程序是Generative Biologics。該平臺于2024年7月被推出,它能設計并優化多類生物藥物一包括多肽,納米抗體及全長抗體一精確地針對特定點進行高親和力結合,利用我們的生成式人工智能模型及勵函數,平臺能設計全新生物藥物,不僅顯示優異的結合親和力,但亦滿足關鍵的可開發性標準,如穩定性,溶解性與可制造性。Generative Biologics能僅以三個步驟生成新的生物藥物分子。其模組化架構支持反復優化,使用戶通過由人工智能預測指導的反鎖過路以優化生物候選藥物.這精簡設計流程,并顯著降低傳統生物藥物開發相關的時間和成本。
英矽智能于2022年12月在中國蘇州推出建筑面積為1,665平方米的原有Life star自動化實驗室。于2025年,我們將實驗室搬遷至上海并升級至下一代自動化實驗室Life Star 2。該自動化實驗室配備了包括新一代測序儀,細胞培養器,細胞分析儀,自動化液體處理機,回聲液體處理器,成像系統,高內涵分析平臺及自動導向車(AGV)的全面儀器。其旨在進一步提高我們內部的實驗室實驗的效率及能力,并促進數據生成以改善我們的Pharma.AI平臺。
與早期的自動化實驗室相比,Life Star 2亦致力于決策流程中減少人為干預。生成式人工智能賦能Life Star 2能自動化點選擇,設計實驗及執行實驗以收集實驗數據,以產生及測試疾病假設,并進一步驗證及訓練人工智能模型。自動化實驗室消除了人工靶點選擇的偏見,并為發現新藥和治療挖掘了力。英矽智能將繼續努力優化Life Star 2的設計,以擴大其能力范圍,縮小其占地面積并優化其建設及營運成本。
除此之外,Life Star2的模塊化能逐步引入新的藥物發現方法等新功能。此舉將增強英矽智能的內部開發能力,同時促進其接受及采用.同時,實驗室的模塊化設計方案使我們能代優化并提升其成本效益,并為全球研究機構提供具吸引力的一攬子解決方案.此外,由于每個生命之星都將在現場配備完整的硬件及軟件解決方案,所有受試者數據的處理均可在現場完成,從而降低數據隱私風險。
03
medicine42平臺
如果現在還覺得英矽智能只能做前期的小分子藥物設計及蛋白質靶點預測,那就大錯特錯了,事實上,它的medicine42平臺可以預測臨床試驗結果。該平臺由inClinico應用程序組成,inClinico為一種多引擎,生成式人工智能臨床試驗分析應用程序,其旨在預測臨床試驗的成功。
inClinico主要專注于在廣泛的治療適應癥中成功進行I期臨床試驗的可能性,因為英矽智能認為I期臨床通常是與受試者首個概念驗證數據相關的主要拐點的關鍵階段。此外,通過仔細審查臨床試驗設計的詳細資料,inClinico亦有助于識別臨床試驗設計中的潛在弱項,使臨床試驗申辦者能作出相應調整,從而可能增加其試驗成功的概率.通過整合及分析各種數據來源,inClinico計算與試驗成功有關的不同部分的評分,包括靶點選擇,藥物結構,試驗設計及受試者資格。該等評分將會綜合評估并納入預測臨床試驗成功推進至開發流程下一階段的概率中,具體而言,靶點選擇評分乃根據與PandaOmics的共享元素進行評估,該等元素估計靶點與相關疾病的關聯以及在相關點的情況下疾病的異質性。此外,藥物結構評分是根據與生成化學的共享元素得出的,這些元素評估分子描述符的貢獻以及ADME(Adme)及毒性特征。
為了進行內部驗證,英矽智能使用2021年之前臨床試驗結果的公開數據對inClinico進行訓練,然后使用2021年1月至2021年9月期間讀取的不同治療領域的臨床試驗結果對平臺進行前瞻性驗證。在該研究中,inClinico基于接收器操作特征(ROC)曲線下的面積(AUC)實現0.86的預測值,該曲線是診斷能力的一種指標,該數字越接近1,表明進入預測進入臨床II期的評估越準確。于2019年,一家全球制藥公司委聘英矽智能應用inClinico來預測該制藥公司選定的正在進行的六項II期臨床試驗中的七項結果,英矽智能部署了inClinico來估計成功的概率,并對該七項結果進行特征分析。截至最后實際可行日期,全部七項臨床試驗結果均已公布,而inClinico正確預測七項結果中的五項。
結語:這就是英矽智能目前平臺的實力,它現在已經真正建成了在創新藥全鏈條覆蓋的人工智能體系,從對蛋白質結構及相互作用,靶點進行分析的biology42,到能夠生成大量小分子并對化學分子進行不斷篩選的chemistry42,到能夠預測臨床結果的medicine42。這些平臺構成了目前英矽智能講故事的基石。
也正因為此,我們需要把英矽智能的估值分為兩個部分,一個部分是與其它藥企(例如石藥)的外包服務收入,這方面類似于CXO,另一部分是自身的管線估值,這方面直接按biotech進行估值就好,
那么英矽智能具體的估值,管線價值,外包研發費用,管線批量BD的估值怎么講呢?我們下半篇進行拆解。
祝大家2026新年快樂、身體健康、工作順遂,感謝一直以來支持我們的讀者朋友。
喜歡我們文章的朋友點個“在看”以及給我們加“星標”吧,不然微信推送規則改變,有可能每天都會錯過我們哦~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.