乳腺癌超聲檢查是早期發現乳腺病變的重要手段,尤其適用于致密型乳腺的女性。然而,由于乳腺結構復雜、病理特征細微且臨床場景多變,超聲圖像的準確判讀對醫生而言極具挑戰。同時,受限于隱私法規和數據獲取難度,公開可用的乳腺超聲數據集十分稀缺,導致傳統深度學習模型在該領域面臨過擬合、泛化能力差等難題。基礎模型的出現為解決數據稀缺問題提供了新思路,但其在乳腺超聲領域的應用潛力尚未被充分挖掘。
2026年4月7日,北京大學王立威、賀笛團隊聯合斯坦福大學James Zou教授以及國內多家醫療機構,在《自然·生物醫學工程》上發表題為“A foundation generative model for breast ultrasound image analysis”的研究。他們成功開發了全球首個面向乳腺超聲圖像分析的基礎生成模型——BUSGen。
![]()
研究團隊構建了包含超過350萬張乳腺超聲圖像的預訓練數據集,覆蓋34種病理亞型,并以此為依托訓練出BUSGen模型。該模型能夠根據少量樣本的引導,生成高質量、多樣化的合成乳腺超聲數據。在僅使用合成數據訓練的情況下,下游模型在多項任務中展現出卓越性能。例如,在乳腺癌早期診斷任務中,BUSGen驅動的模型(BUS-DM)將導管原位癌與良性病變區分開的AUC值達到0.900,顯著優于對比模型。更令人矚目的是,在相同特異性條件下,BUS-DM的平均敏感度比9位認證放射科醫生高出16.5%,首次證明僅靠合成數據訓練的模型能在復雜臨床任務中超越人類專家團隊。
![]()
在乳腺癌篩查任務中,BUS-DM對小病灶(面積占比最小的30%)的檢測平均精確度達到0.702,明顯高于基線模型。對于機會性篩查檢出的病變,其良惡性分類AUC值也提升至0.918。此外,在預測三陰性乳腺癌分子亞型和腋窩淋巴結轉移狀態等預后任務中,BUS-DM同樣表現優異,AUC分別達到0.803和0.895。
研究進一步揭示了生成數據的縮放效應:隨著生成數據量從數千張擴大到百萬級,模型性能持續提升,其表現與使用真實數據訓練的模型高度一致。同時,通過采用先進的采樣策略,BUSGen生成的數據與任何真實患者圖像均不重復,有效保護了患者隱私,為醫療數據的安全共享提供了新方案。
READING
BioPeers
歡迎關注本公眾號,所有內容歡迎點贊,推薦??,評論,轉發~
如有錯誤、遺漏、侵權或商務合作請私信小編~~
歡迎大家投稿課題組 研究進展 、招聘及招生宣傳~
所有文章只為科普、科研服務,無商業目的~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.