<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      自然:生成式AI實現個體千種疾病風險的全景預測

      0
      分享至


      摘要

      醫療決策的核心在于通過理解患者健康狀況以預測并干預疾病進程。人工智能(AI)雖可通過學習大規模健康記錄中的疾病進展模式輔助此任務,但其規?;瘽摿ι形闯浞痔剿鳌1狙芯客ㄟ^改進GPT架構,開發了能模擬疾病進展及競爭關系的模型Delphi-2M。該模型在40萬英國生物樣本庫數據上訓練,并于參數固定條件下,使用190萬丹麥人群數據成功驗證。結果顯示:Delphi-2M在保持與單疾病模型相當準確度的同時,實現了對上千種疾病發生率的同步預測;其生成能力還可合成未來健康軌跡,提供20年疾病負擔估計并訓練無需真實數據的AI模型。本研究通過可解釋AI方法,揭示了疾病聚類的時間依賴性影響,同時暴露了模型習得的數據偏差。研究表明,基于Transformer的模型適用于健康預測與生成任務,能處理大規模人口數據,揭示疾病事件時間關聯,為精準醫學策略提供重要依據。

      關鍵詞:生成式人工智能,共?。∕ultimorbidity),疾病軌跡預測(Disease Trajectory Prediction),Transformer,精準醫學(Precision Medicine),健康軌跡建模,合成健康數據(Synthetic Health Data),個性化健康風險(Personalized Health Risk)

      魏云初丨作者

      趙思怡丨審校


      論文題目:Learning the natural history of human disease with generative transformers 論文鏈接:https://www.nature.com/articles/s41586-025-09529-3 發表時間:2025年9月17日 論文來源:Nature

      當醫療遇見大語言模型

      ——從“治療過去”到“預演未來”

      在傳統醫療中,醫生通過分析患者的病史、體征和檢查結果,試圖拼湊出健康的未來圖景。然而,人類的疾病進程充滿復雜性:急性發作與慢性疾病交織,多種合并癥集群出現,且不同人群的疾病軌跡因遺傳、生活方式和社會經濟因素差異顯著。

      現有的預測模型多局限于單一疾病,而國際疾病分類(ICD-10)中上千種診斷代碼的關聯性與時序動態,始終是流行病學研究的難點。近年來,大語言模型在自然語言處理領域的突破,為這一難題提供了全新思路。正如ChatGPT通過分析上文預測下文,疾病進展同樣可視為一種“健康語言”:每一次診斷如同一個詞匯,其序列隱含了個體健康的“語法規則”。基于這一類比,研究團隊改造了GPT架構,開發出Delphi-2M模型,開創性地實現了對全譜系疾病的生成式預測。

      讀懂“健康語言”:

      Transformer的醫療化改造

      健康數據與自然語言有著相似之處,但也存在本質區別。為了適應醫療數據的特殊性,研究團隊首先創新了數據的表示方法。

      他們構建了一個專用的“健康詞匯表”。它將個體的健康軌跡轉化為由ICD-10診斷代碼、性別、體重指數(BMI)、吸煙與飲酒等生活方式標簽組成的序列。為解決個體健康記錄中長時間無診斷事件的間隔,研究引入“無事件”占位標記,以保留時間連續性并捕捉基線風險隨時間的動態變化。 最終構建的詞匯表涵蓋了1258種不同的健康狀態。

      隨后,針對新的數據表示方法,對標準Transformer架構進行了三項關鍵性改造:

      1. 連續時間編碼:研究人員用基于正弦-余弦函數的連續年齡編碼,替代了傳統Transformer中為文本設計的離散位置編碼。這一革新使模型能精準理解疾病發生的具體時間點,解決了醫療時間軸連續且不規則的核心挑戰。

      2. 雙重預測輸出頭:模型在預測“下一個疾病是什么”之外,增加了一個獨立的輸出頭,用于預測“到下一個事件還有多久”。這種同步輸出“什么”與“何時”的能力,是Delphi-2M能夠生成完整、連續的健康軌跡,而非孤立預測點的關鍵。

      3. 同步事件注意力掩碼:在醫療記錄中,多個診斷常被同時記錄。團隊修改了Transformer的因果注意力掩碼,防止模型混淆同一時間點記錄的不同事件,確保了時間依賴關系的準確建模。

      通過“數據表示”與“架構改造”的緊密結合,Delphi-2M才真正獲得了“理解”復雜“健康語言”的能力。

      隨后,研究團隊對模型的泛化性能進行了系統評估:模型在40萬英國生物樣本庫參與者數據上訓練,保留10萬用于驗證,并在190萬丹麥國民健康登記數據中進行外部測試——所有參數在跨國家測試中完全保持不變


      圖1:a.Delphi-2M模型健康詞匯表示;b.Delphi-2M模型訓練與驗證策略;c.Delphi-2M模型架構。

      精準預測:全疾病譜系的表現

      Delphi-2M在疾病預測方面展現出令人印象深刻的能力。對水痘、哮喘、抑郁癥等十種典型疾病的預測曲線,與真實年齡-性別分層發生率吻合。對于敗血癥等個體差異顯著的疾病,模型能識別出風險顯著高于平均水平的亞群,展現出個性化預測潛力。

      以AUC(受試者工作特征曲線下面積)作為性能指標進行評估。Delphi-2M在內部驗證集中的平均AUC達0.76,97%的診斷預測優于隨機猜測。其中,經年齡分層校正后的死亡預測AUC高達0.97,顯示模型對終末事件的敏銳識別能力。

      特別值得關注的是模型在不同疾病大類中的穩定表現。通過跨ICD-10章節的分析(其“章節”是按疾病類型劃分的最高級別分類),研究人員證實模型在心血管疾病、呼吸系統疾病、腫瘤等不同疾病大類中均保持穩定性能。這表明模型具備廣泛的預測泛化能力,其應用潛力不局限于某些特定疾病領域。

      除個體風險識別外,Delphi-2M在時間維度上也展現出持久的預測能力。即使預測時間延長至10年,模型平均AUC僅從0.76降至0.70,證明其長期預測價值。與常規臨床風險評分相比,Delphi-2M在心血管疾病和癡呆癥預測上表現相當,在死亡風險預測上更優。


      圖2:a.十種典型疾病的模型預測曲線與真實年齡-性別分層發生率的對比;b.模型預測下一個診斷的平均AUC性能及分布;c、d.模 型在不同ICD-10章節中的穩定表現;e.模型平均AUC隨預測時間范圍延長的變化曲線;f.Delphi-2M對特定疾病的預測AUC與現有的臨床風險評分對比。注:AUC是一個衡量預測準確度的通用指標,數值越高代表預測越準確。

      從預測到“預演”:生成式能力的突破

      Delphi-2M的核心創新在于其生成能力。它不僅能預測單一疾病風險,還能按時間順序模擬個體未來可能遭遇的多種健康事件,即生成健康軌跡。這意味著,模型的輸出從對單一事件的靜態預測,升級為了對個體未來健康狀態的時序化模擬。

      為了驗證這種生成軌跡的可靠性,研究團隊以60歲為時間節點,為6.3萬名參與者生成后續健康軌跡。結果顯示,模擬數據在70-75歲年齡段的疾病分布與真實數據密切吻合。在定量評估上,相比僅依賴年齡性別的基線模型,Delphi-2M的條件生成將疾病標記正確預測率從12-13%提升至14-17%。這初步證明了生成軌跡不僅整體分布合理,在個體層面也具備更精準的預測能力。

      更重要的是,這種生成式能力為理解風險因素提供了全新的動態視角。通過模擬不同吸煙、飲酒、BMI人群的未來疾病負擔,模型清晰"預演"了生活方式對健康的長期影響。例如,在模擬軌跡中,吸煙者群體的慢性呼吸道疾病發生率隨時間顯著上升,這一發現與經典的流行病學結果相符,從而在數據層面驗證了模型模擬的現實指導意義。

      除了深化認知,該生成能力還有一個極具潛力的實用價值——合成數據的創造。 實驗表明,完全基于合成數據訓練的模型,在真實驗證集上仍達到0.74的AUC,僅比原模型低3個百分點。這一結果強有力地證實,合成數據再現了真實數據的核心統計規律。因此,該方法為醫療AI開發中克服數據隱私與孤島壁壘,提供了一條創新的技術路徑。


      圖3:a.模型從60歲開始采樣生成多種可能的未來健康軌跡;b.模型生成的軌跡(Sampled) 與真實觀測數據(Observed)的疾病分布;c.在軌跡生成任務中,Delphi-2M相比僅依賴年齡性別的基線模型,在各個時間點能更準確地預測出具體的疾病標記;d.不同吸煙狀態的人群,在模擬的未來軌跡中,其慢性呼吸道疾病負擔的顯著差異;e.與b相同,針對從出生開始的模擬進行評估;f.使用UBK數據與模型合成數據訓練的模型,二者的AUC性能對比。

      可解釋性:理解模型的“思考”邏輯

      對于醫療AI來說,可解釋性是其贏得臨床信任的關鍵。Delphi-2M通過多層次的分析,讓我們得以窺見其內部的“思考”邏輯。

      在結構層面,模型的內部表示自發形成了有意義的疾病圖譜。在嵌入空間中,相同ICD-10章節的疾病(如糖尿病相關視網膜病變與神經病變)會自動聚類。更具啟示性的是,具有高急性死亡風險的疾?。ㄈ缧募」K?、敗血癥)與死亡標記聚集。這表明模型無需顯式指導,便通過學習疾病在數據中的聯合分布,掌握了它們之間的臨床關聯——這本質上是基于其統計共現關系,而非因果機制。

      在因果層面,該模型分析量化了特定病史對未來風險的驅動作用。例如,分析顯示消化系統疾病史可使胰腺癌風險提升19倍,而一旦確診胰腺癌,死亡風險激增近萬倍。研究進一步揭示了這種影響的時間依賴性:妊娠相關疾病的影響集中在5年內,而精神疾病和腫瘤的相互影響則持續更久。

      在動態層面,注意力機制展現了模型處理時間依賴性的精巧能力。模型對癌癥診斷保持長達數年的“關注”,反映出其長期死亡風險的把握;而對敗血癥等急性事件,其注意力快速衰減,這與臨床觀察到的風險變化模式一致。這種動態注意力權重,是模型能夠自適應地權衡歷史事件重要性的核心。


      圖4:a.不同章節疾病編碼在嵌入空間中的UMAP可視化圖;b.消化系統疾病史等因素如何逐步將胰腺癌風險顯著推高;c.不同疾病在短期(如5年內) 和長期(如10年后)的相互影響強度;d.基于SHAP值的死亡率預測影響程度隨診斷后時間的變化分析

      局限與挑戰:前進路上的障礙

      Delphi-2M也面臨一些挑戰。訓練數據的選擇偏差是一個主要問題:英國生物樣本庫參與者以白人、高教育程度人群為主,導致模型在少數族裔和低收入群體中預測性能下降。招募時40-70歲的年齡范圍造成“永生偏倚”——忽略了招募前死亡個案,間接影響高死亡率疾病的預測準確性。

      此外,數據模態的單一性也限制了模型潛力。當前模型僅基于診斷代碼和基礎生活方式信息,尚未整合基因組學、影像學、處方記錄等關鍵數據。這限制了模型洞察疾病的深層生物學機制的能力,特別是在強遺傳成分的疾病或依賴影像學檢查的早期病變方面。

      跨醫療系統的泛化能力雖有展示但仍不完美。在丹麥數據測試中,模型AUC從0.76降至0.67,雖保持良好相關性,但仍揭示國家間醫療體系差異對預測的影響。這提示未來應用需進行本地化校準。

      未來展望:AI重塑醫療的無限可能

      盡管存在挑戰,Delphi-2M的出現無疑開辟了新的可能性。它的架構為整合多模態數據留下豐富接口。未來可納入處方記錄、基因組學、穿戴設備數據,構建更全面的健康嵌入空間。同時,模型直接處理臨床文本的潛力,將打破結構化數據的限制。

      在應用層面,Delphi類模型可朝兩個方向發展:臨床決策支持識別傳統年齡標準之外的高風險個體,優化篩查資源配置;公共衛生規劃,通過聚合個體預測,模擬區域性疾病負擔變遷,為醫療資源布局提供數據支撐。

      研究人員展望,未來幾年內患者可能直接受益——醫生借助類似工具就能告知患者:“你未來可能面臨幾個主要風險,有幾件事現在可以改變結果”。

      Delphi-2M的出現,標志著疾病預測從“單疾病、靜態評估”邁向“全譜系、動態生成”的新范式。通過將源自自然語言處理的Transformer架構創造性應用于健康軌跡建模,我們不僅獲得了預測疾病的能力,更擁有了“預演”未來的獨特視角。

      在人工智能與醫療深度融合的時代,這種能夠揭示疾病演進內在模式的模型,或許終將為我們制定更精準、更個性化的健康決策提供關鍵依據。

      參考文獻

      [1] Shmatko, A., Jung, A.W., Gaurav, K. et al. Learning the natural history of human disease with generative transformers. Nature (2025). https://doi.org/10.1038/s41586-025-09529-3

      [2] Garg, M. et al. Disease prediction with multi-omics and biomarkers empowers case-control genetic discoveries in the UK Biobank. Nat. Genet. 56, 1821–1831 (2024).

      [3] Fry, A. et al. Comparison of sociodemographic and health-related characteristics of UK Biobank participants with those of the general population. Am. J. Epidemiol. 186, 1026–1034 (2017).

      [4] Sudlow, C. et al. UK biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. PLoS Med. 12, e1001779 (2015).

      [5] Anatürk, M. et al. Development and validation of a dementia risk score in the UK Biobank and Whitehall II cohorts. BMJ Ment. Health 26, e300719 (2023).

      [6] Schmidt, M. et al. The Danish National Patient Registry: a review of content, data quality, and research potential. Clin. Epidemiol. 7, 449–490 (2015).

      [7] Helweg-Larsen, K. The Danish register of causes of death. Scand. J. Publ. Health 39, 26–29 (2011).Danish National Health Registry. 2018. Population-wide health records.

      大模型與生物醫學:

      AI + Science第二季讀書會

      生物醫學是一個復雜且富有挑戰性的領域,涉及到大量的數據處理、模式識別、理論模型建構和實驗驗證等問題。AI基礎模型的引入,使得我們能夠從前所未有的角度去觀察和理解這個領域的問題,加速科學研究的步伐,提高醫療服務的效率和效果。這種交叉領域的合作,標志著我們正在向科技與生物醫學深度融合的新時代邁進,對于推動科學研究、優化醫療服務、促進人類健康有著深遠的影響。

      集智俱樂部聯合西湖大學助理教授吳泰霖、斯坦福大學計算機科學系博士后研究員王瀚宸、博士研究生黃柯鑫、黃倩,華盛頓大學博士研究生屠鑫明,共同發起,共學共研相關文獻, 探討基礎模型在生物醫學等科學領域的應用、影響和展望。 讀書會已完結,現在報名可加入社群并解鎖 回放 視頻權限。

      詳情請見:

      -一年一度特惠-


      1.

      2.

      3.

      4.

      5.

      6.

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      曹西平驟逝!曾自曝患憂郁癥獨居泰國 去年才嘆老了走不動

      曹西平驟逝!曾自曝患憂郁癥獨居泰國 去年才嘆老了走不動

      ETtoday星光云
      2025-12-30 07:10:09
      俄稱烏企圖襲擊普京官邸

      俄稱烏企圖襲擊普京官邸

      界面新聞
      2025-12-29 23:30:43
      中央特科最美傳奇女特工被判槍決,毛主席拍案大怒:她是全黨的恩人

      中央特科最美傳奇女特工被判槍決,毛主席拍案大怒:她是全黨的恩人

      睡前講故事
      2025-12-21 16:15:28
      紅薯立大功!研究發現:堅持吃紅薯一段時間,或迎來5個好轉信號

      紅薯立大功!研究發現:堅持吃紅薯一段時間,或迎來5個好轉信號

      全球軍事記
      2025-12-27 17:23:45
      正式加盟!你好,模型怪!終于殺回了NBA

      正式加盟!你好,模型怪!終于殺回了NBA

      籃球實戰寶典
      2025-12-29 23:08:44
      貴金屬遭遇“巨震星期一”:現貨白銀從+6%到-8% 金鉑鈀同步跳水

      貴金屬遭遇“巨震星期一”:現貨白銀從+6%到-8% 金鉑鈀同步跳水

      財聯社
      2025-12-30 05:25:09
      1953年,王震突然被撤職,毛主席拍桌子:你知不知道,你把中央的大事給搞砸了!

      1953年,王震突然被撤職,毛主席拍桌子:你知不知道,你把中央的大事給搞砸了!

      桃煙讀史
      2025-12-14 18:02:22
      “兒子都腺樣體了,還吃烤腸呢?”一份糊弄早餐暴露家長的低認知

      “兒子都腺樣體了,還吃烤腸呢?”一份糊弄早餐暴露家長的低認知

      妍妍教育日記
      2025-12-26 17:18:26
      1979年對越自衛反擊戰期間,中央早已下達撤軍命令,許世友卻堅持要再打兩小時,這是為何?

      1979年對越自衛反擊戰期間,中央早已下達撤軍命令,許世友卻堅持要再打兩小時,這是為何?

      史海殘云
      2025-12-25 12:05:18
      深夜,全線下跌!發生了什么?

      深夜,全線下跌!發生了什么?

      證券時報
      2025-12-29 23:35:17
      馬云預言兌現?2026年手上還握有存款的人,別忽視這三大現實

      馬云預言兌現?2026年手上還握有存款的人,別忽視這三大現實

      來科點譜
      2025-12-29 09:01:09
      亞當斯:楊瀚森吃什么由他自己做主;威少經常吃糖還是很強

      亞當斯:楊瀚森吃什么由他自己做主;威少經常吃糖還是很強

      懂球帝
      2025-12-29 09:46:12
      豪宅,打了市場一記耳光

      豪宅,打了市場一記耳光

      格隆匯樓市V
      2025-12-29 21:46:01
      斷層封神!河北彩花:一顰一笑皆風情,引得全網瘋狂為她打 call

      斷層封神!河北彩花:一顰一笑皆風情,引得全網瘋狂為她打 call

      灼灼小齊
      2025-12-30 00:15:03
      烏軍一個人堅守陣地472天,撤下火線時,已經幾乎不會走路!

      烏軍一個人堅守陣地472天,撤下火線時,已經幾乎不會走路!

      百態人間
      2025-12-29 16:36:37
      突發特訊!解放軍海報中三艘美軍核潛艇被攔截

      突發特訊!解放軍海報中三艘美軍核潛艇被攔截

      在新加坡生活
      2025-12-30 07:57:06
      一夜虧光1800萬,白銀波動率飆至90%,不是交易,是屠殺!....

      一夜虧光1800萬,白銀波動率飆至90%,不是交易,是屠殺!....

      思哲與創富
      2025-12-29 18:57:19
      開拓者爆冷升至東部第三,楊瀚森數據全隊第二高但細節存憾

      開拓者爆冷升至東部第三,楊瀚森數據全隊第二高但細節存憾

      小皷拍客在北漂
      2025-12-29 10:30:36
      5艘航母云集中國近海,中美巔峰對陣,特朗普明牌,逼著中國接招

      5艘航母云集中國近海,中美巔峰對陣,特朗普明牌,逼著中國接招

      現代小青青慕慕
      2025-12-26 14:42:10
      日本侵華長達14年,為何打印度一次就放棄,10萬重兵一半喪命?

      日本侵華長達14年,為何打印度一次就放棄,10萬重兵一半喪命?

      墨說古今
      2025-12-23 23:25:01
      2025-12-30 10:19:00
      集智俱樂部 incentive-icons
      集智俱樂部
      科普人工智能相關知識技能
      5574文章數 4661關注度
      往期回顧 全部

      科技要聞

      Manus官宣加入Meta,收購金額達數十億美金

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      頭條要聞

      媒體:賴清德稱"大陸不敢越雷池" 第二天解放軍就演習

      體育要聞

      “史上最貴”的世界杯,球迷成了韭菜

      娛樂要聞

      44歲林俊杰官宣戀情 帶23歲女友見家長

      財經要聞

      翁杰明:宏觀數據與居民微觀感受存在差距

      汽車要聞

      “路”要越走越深,猛士的智能越野時代來了

      態度原創

      數碼
      藝術
      教育
      本地
      公開課

      數碼要聞

      3999元!閃極loomos AI顯示眼鏡S1發布:整機29克全球最輕

      藝術要聞

      毛主席寫給表兄的信,認全字才能算行家,你能行嗎?

      教育要聞

      湖南中醫大學湖北分數線揭秘!別慌!

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人免费xxxxx在线观看| 边啃奶头边躁狠狠躁| 精品国产一卡| 亚洲人成网站观看在线观看| 性猛交ⅹxxx富婆视频| 天堂AV在线免费观看| 日韩激情一区二区| 国产精品无码av无码| 久久精品国产99精品国产2021| 久久国产东京热加勒比| 国产欧美另类久久久精品丝瓜| 亚洲日韩av无码一区二区三区| 新巴尔虎左旗| 老熟女网站| 91国产精品| 亚洲国产精品久久一线不卡| 人妻AV中文字幕| www.com黄色| 久久AV中文综合一区二区| 久久国产色av免费观看| 天天躁日日躁狠狠躁欧美老妇小说| 成人日本有码在线| 亚洲一区黄色| 无遮挡边吃摸边吃奶边做| 中文字幕精品无亚洲字幕| 中文字幕无码视频播放| 国产精品美女一区二三区| 黄桃av无码免费一区二区三区| 麻豆人人妻人人妻人人片av| 常德市| 青青草乱人| 女人腿张开让男人桶爽 | 色综合色综合久久综合频道88| 无码人妻aⅴ一区二区三区用会员| 高级无码| 超碰免费人妻| 亚洲丰满熟女一区二区v| 18禁美女裸身无遮挡免费网站| 男人和女人做爽爽视频| 精品国模无码| 亚洲精品成人网|