近日,新加坡國立大學博士后研究員藺奇卡和合作者研發了DeepMedix-R1,這是一個專為胸部 X 光圖像解讀設計的醫學基礎模型。DeepMedix-R1的創新之處在于其能夠生成結構化的推理過程,并將推理步驟與圖像中的具體區域精確關聯,為醫生提供清晰、可追溯的診斷依據。
![]()
DeepMedix-R1通過整合高質量合成推理數據和在線強化學習,不僅在報告生成和視覺問答任務中取得了卓越的性能,還顯著提升了模型對圖像局部區域的理解和推理能力。這種結合為醫學影像分析領域提供了新的方法論,證明了通過精心設計的訓練流程,可以使模型具備更強的可解釋性和臨床適用性。研究團隊發現在醫學基礎模型的訓練中引入在線強化學習,能夠有效地同時提升模型的推理質量和生成性能。這一發現為未來醫學AI模型的優化提供了新的思路,即通過與環境(在這里是醫學影像和診斷任務)的持續交互,模型能夠不斷自我完善,更好地適應臨床實際需求。
![]()
(來源:https://arxiv.org/pdf/2509.03906)
DeepMedix-R1可作為醫生的智能助手,幫助快速、準確地解讀胸部X光圖像,提供初步診斷建議和詳細的推理過程,從而輔助醫生做出更明智的診斷決策,尤其在醫療資源相對匱乏的地區,能夠有效提升診斷效率和準確性。除此之外,在遠程醫療服務中,DeepMedix-R1可以對上傳的胸部X光圖像進行實時分析和解讀,為患者提供及時的診斷反饋,有助于早期發現疾病,特別是在大規模疾病篩查項目中,能夠提高篩查效率和覆蓋率,降低醫療成本。
醫學AI領域,尤其是醫學影像分析方向,盡管大模型取得了顯著進展,但在臨床實踐中的應用仍面臨諸多挑戰。研究團隊發現,現有的醫學基礎模型在生成診斷結果時,往往缺乏透明的推理過程和對圖像局部區域的精確關聯,這使得醫生難以驗證模型的決策依據,進而限制了其在高風險的醫療環境中的可靠性和可信度。具體來說,現有模型存在以下兩個主要問題:
1)缺乏透明推理:當前的醫學模型多以“黑盒”方式運行,僅提供診斷答案,未能揭示其背后的臨床推理邏輯。這種不可解釋性導致醫生無法判斷模型的判斷是否基于正確的醫學知識,從而阻礙了其在臨床決策中的有效應用。
2)局部定位能力有限:雖然現有模型在整體圖像解讀上表現尚可,但在精確定位醫學圖像中的具體病變區域方面能力不足。然而,放射學和病理學診斷本質上依賴于對特定解剖特征或病理細節的精細評估,這一局限性嚴重制約了模型的臨床實用性。
因此,研究團隊開展了這項研究,旨在開發一個具備透明推理能力和局部定位功能的醫學基礎模型,以解決上述問題,推動醫學AI向更可靠、更易于臨床部署的方向發展。
基于對醫學AI領域現狀的深入調研分析,以及藺奇卡與Swapnil Mishra和Mengling Feng教授的深入交流討論,研究團隊首先確定了開發具備推理能力的胸部X光解讀模型的研究課題。之后項目主要經過了三個階段:數據收集、模型設計與初步訓練、全面評估與驗證。研究團隊先收集和整理了公開數據集如MIMIC-CXR、OpenI等,并進行了嚴格的清洗工作,確保數據的準確性和多樣性;之后設計了DeepMedix模型的基礎架構和訓練方式,采用先進的視覺-語言模型作為骨干,并進行三階段的訓練;最后對DeepMedix-R1進行了全方位的評估,包括在多個公開數據集上的性能測試、與現有模型的對比分析、專家評估等,從定量指標到定性分析,多角度驗證了模型的有效性和優越性,確保其在實際應用中能夠可靠地發揮作用。“北京郵電大學的朱一凡老師組織了醫療專家對推理過程的人工評價,在此再次表示感謝。”藺奇卡表示。
研究中,最令藺奇卡印象深刻的主要有兩件事。其一是在強化學習訓練的初期階段,模型表現非常不穩定,甚至一度出現性能倒退。研究團隊投入了大量時間排查問題根源,最終通過反復調整獎勵函數的設計以及其他超參數,成功克服了這一困難。其二是,盡管 DeepMedix-R1在多項指標上取得了顯著優勢,但專家人工評估發現,其推理過程中仍會出現不相關或錯誤的描述,這也是當前基礎模型普遍面臨的挑戰。
研究團隊已將這一問題列入后續重點改進計劃,希望在未來版本中逐步提升推理的準確性和可靠性。
目前,研究團隊已有明確的后續計劃,主要是方法和應用兩方面的工作。第一,擴展多模態能力:將模型擴展到CT、MRI等多模態影像數據,支持更廣泛的醫學影像分析,并設計多樣化的強化學習獎勵,進一步減少模型幻覺,提升推理步驟的準確性和完整性,目標是達到接近人類專家的水平。第二,從應用角度來說,計劃與更多的醫院合作,開展臨床試點研究,驗證模型在真實場景中的效果和可用性。
據介紹,從本科到博士階段,藺奇卡先后就讀于北京理工大學、西安交通大學和南洋理工大學。在此期間,藺奇卡對AI領域的前沿技術產生了濃厚的興趣,并逐步確立了在該方向深入研究的決心。博士畢業之后,在新加坡國立大學作為博士后研究員開展工作,專注于大模型推理與醫療人工智能的研究。期間發表多篇頂會論文,并參與國家重點研發計劃和新加坡衛生部課題在內的多項重大科研項目。“目前我正在考慮創業,在和醫院的專業醫生接觸,打算先了解真實醫療場景的需求。”他最后表示。
參考資料:https://arxiv.org/pdf/2509.03906
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.