![]()
![]()
近日,西班牙安達盧西亞進步與健康公共基金會等單位合作共同在期刊《Advanced Science》上發(fā)表了研究論文,題為“High-Fidelity Synthetic Data Replicates Clinical Prediction Performance in a Million-Patient Diabetes Cohort”,本研究中,研究人員利用雙對抗自編碼器合成了源自安達盧西亞人口健康數(shù)據(jù)庫中近 100 萬糖尿病患者的真實世界縱向數(shù)據(jù)集。研究人員建立了一個全面的評估框架,以評估這些數(shù)據(jù)在機器學(xué)習(xí)任務(wù)中的效用,并將分析范圍擴展到標準指標之外,以闡明模擬疾病軌跡的生物醫(yī)學(xué)合理性。
醫(yī)療保健數(shù)字化:數(shù)據(jù)激增、去識別挑戰(zhàn)與重新識別風(fēng)險評估
01
醫(yī)院和醫(yī)療保健機構(gòu)的數(shù)字化催生了一個時代,在這個時代,醫(yī)療保健系統(tǒng)已成為數(shù)據(jù)生成量最大的領(lǐng)域之一。這種數(shù)字化轉(zhuǎn)型導(dǎo)致了各種各樣的大量數(shù)據(jù)集呈指數(shù)級增長,涵蓋了眾多患者信息、臨床記錄和與健康相關(guān)的變量。據(jù)目前估計,超過 30% 的現(xiàn)有數(shù)據(jù)是在醫(yī)療保健環(huán)境中生成的。這些豐富的數(shù)據(jù)來源為新生物醫(yī)學(xué)知識的創(chuàng)造奠定了基礎(chǔ),使研究人員能夠從真實世界的患者經(jīng)歷和結(jié)果中獲得見解,為不斷擴大的真實世界證據(jù)(RWE)領(lǐng)域做出了貢獻。在推動電子健康記錄(EHR)的二次利用的同時保護敏感醫(yī)療數(shù)據(jù),醫(yī)療保健機構(gòu)采用了去識別技術(shù)來創(chuàng)建匿名數(shù)據(jù)集。然而,去識別雖然降低了隱私風(fēng)險,但并不能完全保證免受重新識別嘗試或?qū)⒒颊邤?shù)據(jù)與外部來源關(guān)聯(lián)的攻擊。為評估并降低重新識別的風(fēng)險,人們已對多種方法進行了研究,尤其側(cè)重于個體患者的軌跡模式。實際上,當(dāng)對患者軌跡進行充分觀察時,其會保留獨特的特征,從而加大重新識別的風(fēng)險。
靜態(tài)預(yù)測性能
02
當(dāng)按糖尿病診斷年份對模型的預(yù)測性能進行細分時,AUROC 分數(shù)隨時間推移持續(xù)提升的趨勢十分明顯。無論是基于真實數(shù)據(jù)還是合成數(shù)據(jù)訓(xùn)練的模型,都呈現(xiàn)出這一趨勢。如圖所示,基于合成數(shù)據(jù)副本訓(xùn)練的模型始終緊跟基于原始數(shù)據(jù)訓(xùn)練的模型的性能,盡管存在細微但持續(xù)的性能差距。此外,基于真實數(shù)據(jù)和合成數(shù)據(jù)增強數(shù)據(jù)集訓(xùn)練的混合模型的性能幾乎與僅基于真實數(shù)據(jù)訓(xùn)練的模型重合,表明在這種情況下數(shù)據(jù)增強并未提供額外的預(yù)測價值。在基于原始數(shù)據(jù)訓(xùn)練的模型中,男性模型的表現(xiàn)比女性模型更穩(wěn)定,這一模式在基于合成數(shù)據(jù)訓(xùn)練的模型中也得到了重現(xiàn)。與整體 AUROC 結(jié)果一致的是,當(dāng)分別對兩性進行分析時,用合成樣本擴充數(shù)據(jù)并未帶來性能提升。研究人員還報告了每年評估的患者總數(shù),以及按性別劃分的患者數(shù),同時還報告了 AUROC 得分的均值和標準差。
![]()
按糖尿病診斷年份劃分的預(yù)測性能(AUROC)(SSMR-優(yōu)化版)
結(jié)論
03
綜上,研究人員證明,從一個包含超過 100 萬糖尿病患者的大型真實世界隊列中生成的高保真合成數(shù)據(jù),能夠在一項具有臨床相關(guān)性的任務(wù)中成功復(fù)制真實數(shù)據(jù)的預(yù)測性能。
參考資料:
https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202516196
【關(guān)于投稿】
轉(zhuǎn)化醫(yī)學(xué)網(wǎng)(360zhyx.com)是轉(zhuǎn)化醫(yī)學(xué)核心門戶,旨在推動基礎(chǔ)研究、臨床診療和產(chǎn)業(yè)的發(fā)展,核心內(nèi)容涵蓋組學(xué)、檢驗、免疫、腫瘤、心血管、糖尿病等。如您有最新的研究內(nèi)容發(fā)表,歡迎聯(lián)系我們進行免費報道(公眾號菜單欄-在線客服聯(lián)系),我們的理念:內(nèi)容創(chuàng)造價值,轉(zhuǎn)化鑄就未來!
轉(zhuǎn)化醫(yī)學(xué)網(wǎng)(360zhyx.com)發(fā)布的文章旨在介紹前沿醫(yī)學(xué)研究進展,不能作為治療方案使用;如需獲得健康指導(dǎo),請至正規(guī)醫(yī)院就診。
責(zé)任聲明:本稿件如有錯誤之處,敬請聯(lián)系轉(zhuǎn)化醫(yī)學(xué)網(wǎng)客服進行修改事宜!
微信號:zhuanhuayixue
★ 2月份熱門內(nèi)容 ★
01
02
03
04
05
06
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.