本文是專業學術論文解讀,不做醫療建議。
今天,《柳葉刀》主刊發表了瑞典 MASAI 試驗(Mammography Screening with Artificial Intelligence,人工智能輔助乳腺 X 線篩查試驗)的最終結果。這是全球首個完整結題的大規模 AI 乳腺癌篩查隨機對照試驗(RCT,Randomized Controlled Trial),超過 10.5 萬名女性參與,歷時近五年,核心結論是:AI 輔助篩查在間期癌發生率上不劣于傳統雙人閱片,同時將放射科醫師的閱片工作量削減了 44%。
![]()
圖丨相關論文(來源:The Lancet)
所謂雙人閱片,是歐洲指南推薦的標準流程,每張乳腺 X 線片都需要兩位放射科醫師獨立判讀,以降低漏診風險。這套機制固然嚴謹,卻對醫療人力提出了極高要求。MASAI 試驗要回答的問題很直接:AI 介入之后,能不能在不犧牲篩查質量的前提下,緩解這種結構性的人力緊張?
試驗將參與者隨機分配至 AI 輔助組或傳統雙人閱片組。AI 組使用荷蘭 ScreenPoint Medical 公司開發的 Transpara 系統,它在閱片流程中承擔兩項功能:一是分流,根據影像的風險評分(1-10 分)決定該由一位還是兩位放射科醫師進行判讀,評分低于 10 的影像僅需單人閱片,評分為 10 的高風險影像仍由雙人閱片;二是輔助檢測,為評分較高的影像標注可疑區域供醫師參考。
![]()
圖丨實驗概況(來源:The Lancet)
根據最終數據,AI 組與對照組的間期癌(interval cancer,即兩次篩查之間被診斷出的乳腺癌)發生率分別為每千人 1.55 例和 1.76 例,比值比 0.88,95% 置信區間落在預設的 20% 非劣效性邊界之內。敏感性方面,AI 組為 80.5%,對照組為 73.8%,差異達到統計學顯著(p=0.031)。特異性兩組均為 98.5%,沒有區別。
間期癌率是評估篩查項目有效性的核心指標。間期癌通常意味著篩查時漏診,且往往具有更差的預后特征。MASAI 試驗雖然并非為檢驗間期癌的統計學優效性而設計,但描述性分析顯示,AI 組的侵襲性間期癌比對照組少了 16%,腫瘤直徑超過 20 毫米的 T2+ 分期病例少了 21%,預后較差的非 luminal A 分子亞型(包括三陰性、HER2 陽性、luminal B 等)減少了 27%。
![]()
圖丨間期癌發生率、敏感性和特異性(來源:The Lancet)
這與此前報告的篩查檢出數據形成呼應:AI 組在篩查階段多檢出了 29% 的癌癥,主要是小體積、淋巴結陰性的早期侵襲性癌癥,其中非 luminal A 亞型多檢出 27%。兩組數據合在一起看,指向一個推論:AI 幫助在篩查階段攔截了更多具有臨床意義的早期腫瘤,繼而減少了后續間期內被發現的晚期病例。
但這個推論仍需謹慎對待。試驗首席研究者、隆德大學放射診斷學副教授 Kristina L?ng 指出,AI 組對 luminal A 型癌癥(通常被認為惰性、預后較好)的檢出增加了 21%,而 luminal A 型間期癌的數量兩組基本持平;原位導管癌的檢出也有所上升。
這是否會帶來過度診斷的風險,即檢出了終生不會進展、不需要治療的病變,需要后續篩查輪次的數據來厘清。這正是乳腺癌篩查領域長期存在的張力:檢出更多未必等于做得更好。篩查的真正價值在于發現那些若不及時干預就會惡化的病變。
![]()
圖丨 Kristina L?ng(來源:Cancerfonden)
如今,全球乳腺影像學領域正面臨人力危機。瑞典的情況尚屬可控,但在英國,皇家放射科醫師學會 2023 年的報告顯示,該國放射科醫師缺口已達 30%,預計到 2028 年將擴大至 40%。
正是在這一壓力下,英國國家醫療服務體系(NHS)于 2025 年 2 月宣布啟動 EDITH 試驗(Early Detection using Information Technology in Health),計劃招募近 70 萬名女性,在 30 個篩查點測試 5 種不同的 AI 平臺,并獲得 1,100 萬英鎊的政府資助。EDITH 將是迄今規模最大的 AI 乳腺癌篩查前瞻性研究,其設計思路很大程度上借鑒了 MASAI 的經驗。
監管層面,AI 在乳腺癌診斷領域的審批也在快速演進。截至 2025 年底,美國 FDA 已通過 510(k)途徑批準了數十款乳腺癌 AI 輔助診斷產品。2025 年 5 月,Clairity 公司的五年風險預測工具 Clairity Breast 成為首個通過 De Novo 途徑獲批的 AI 乳腺癌風險預測平臺,它僅憑標準乳腺 X 線影像即可評估未來五年的患癌風險。
但批評者指出,多數獲批產品的臨床證據仍停留在回顧性研究層面,對間期癌、分期分布、生存率等具有臨床意義的終點指標鮮有涉及。MASAI 試驗的價值不僅在于其結論,更在于它為醫療 AI 領域提供了一個方法論參照:前瞻性、隨機化、大樣本、以硬終點為主要結局指標。
不過,MASAI 也存在明顯的局限。試驗僅在瑞典西南部的四個篩查點進行,使用單一品牌的乳腺 X 線設備(GE Healthcare Senographe Pristina)和單一的 AI 系統,放射科醫師的經驗水平普遍較高,基線召回率本就偏低(約 2%)。這些條件在其他國家和地區未必能夠復制。
此外,受限于瑞典的隱私法規,試驗未收集參與者的種族和民族數據,因而無法評估 AI 表現在不同人群中的一致性。更關鍵的是,這仍是單輪篩查的結果;AI 帶來的敏感性提升能否在后續篩查中持續,或者是否會因為檢出更多無臨床意義的病變而產生長期的過度診斷負擔,都有待觀察。
還有一個值得注意的問題:當 AI 介入到一個運轉了數十年的篩查體系中,它實際上在重塑整個工作流程。MASAI 試驗中,AI 的分流功能使約 89% 的影像僅由一位放射科醫師閱讀,這與傳統雙人閱片的邏輯已有根本性差異。
如果 AI 的分流判斷在某些亞群體中存在偏差,這種偏差可能會被系統放大,而非被另一位人類閱片者糾正。試驗數據顯示,AI 在致密型乳腺中的敏感性提升與其他乳腺密度組別大體一致,但更細粒度的分層分析和外部驗證仍是必要的。
歐洲乳腺癌倡議委員會(European Commission Initiative on Breast Cancer)在 2023 年發布的指南中,對 AI 輔助雙人閱片給出了“有條件推薦”(低確定性證據),而對 AI 輔助單人閱片則持保留態度。這一立場在 MASAI 最終結果出爐后是否會調整,是接下來值得關注的政策動向。
瑞典和丹麥的部分區域已經在試驗結論正式發布前就開始部署類似的 AI 輔助篩查流程,主要驅動力是人力短缺。但推廣的速度不應超越證據的邊界。正如研究團隊在論文中所言:后續篩查輪次的數據、成本效益分析、以及在更多元人群和臨床場景中的驗證,將決定 AI 輔助篩查究竟能走多遠。
參考資料:
1.https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(25)02464-X/
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.