“目前手術機器人的智能化進程,可類比汽車自動駕駛的分級體系,整體處于L1基礎輔助到L2進階輔助的廣泛落地階段,僅在少數標準化術式中進入L3條件自主的臨床前探索階段,遠未達到真正的全自主操作,用更貼合臨床的話來說,就是‘能輔助放大醫生的手,但替代不了醫生的腦’。”
近日,香港大學深圳醫院神經外科副主任醫師葉小帆接受第一財經記者采訪時談及手術機器人發展現狀。作為一名外科醫生,他在專注神經外科疾病診療同時,也作為核心研發成員,深度參與了中科院香港人工智能研究院牽頭的手術視頻大模型研發。
![]()
近年來,越來越多的手術機器人在探索與AI輔助技術結合,但AI的加入,能否補全手術場景中最核心的“臨床決策”拼圖?
今年年初,科技富豪、特斯拉CEO馬斯克曾在一次公開訪談中拋出驚人言論,稱“3年后,AI將取代外科醫生”。這究竟是天方夜譚,還是下一代外科手術領域的終極形態?
手術從依賴個人經驗到可量化
3月24日,中國科學院香港創新研究院人工智能與機器人創新中心正式發布了“術影”SurgMotion手術視頻大模型,相關研究成果已于同期上線國際學術平臺arXiv。
中國科學院香港創新研究院人工智能與機器人創新中心主任、研究員劉宏斌對第一財經記者表示,手術流程中大量的核心信息是以手術視頻的形式被保留下來的,既是年輕醫生術前學習、術后復盤的核心工具,也是手術場景智能輔助與臨床決策支持的核心基礎。
該模型的推出,一方面旨在成為可靠的教學輔助工具,幫助年輕醫生完成規范化的手術復盤與技能提升;另一方面也希望推動具身智能手術機器人的研發,成為具身智能系統的核心感知功能模塊,輔助外科醫生實時理解術中手術進程、解剖環境與操作風險。
根據國家統計局數據,我國醫療衛生機構住院病人手術人次已從2019年的6930.44萬次攀升至2023年的1.04億次。與之相對的是,我國手術醫師分布嚴重不均衡,基層地區極度缺乏高水平手術醫師,而培養一名合格的手術醫師,需要經過“5+3+X”年的規范化培養與臨床歷練。
中山大學附屬第一醫院呼吸與危重癥醫學科副主任、主任醫師廖槐表示,醫生的臨床決策能力需要終身學習,但個人的視野與經驗始終存在局限,而AI大模型能夠集成全行業海量的臨床數據與頂尖專家的經驗,幫助醫生補齊視野短板、提升決策能力。
“我們經常說,知名外科專家在面對手術中棘手問題時,總能拿出成熟的解題思路與應對方法。但在沒有AI大模型的時代,這些寶貴的臨床經驗主要靠‘師傅帶徒弟’的模式口傳心授,很多細節會隨著時間流逝。有了AI大模型后,我們可以將這些經驗進行結構化拆解、提煉出核心規范,普及給更多年輕醫生與基層醫師,同時也能為醫生術中的輔助決策提供循證參考。”廖槐說。
中國科學院香港創新研究院人工智能與機器人創新中心研究員易東表示,AI輔助的手術機器人,能夠顯著提升手術機器人的視覺感知與場景理解能力,真正將手術從“依賴醫生個人經驗”,轉變為“可量化、可復制、可推廣”的標準化規范。
長期以來,手術視頻大模型的開發始終面臨三大核心挑戰:高質量手術標注數據極度稀缺、長時程視頻模型預訓練難度高、難以兼顧手術場景多維度的感知需求。
易東介紹,“術影”SurgMotion手術視頻大模型是目前業內規模最大、覆蓋場景最完整的手術視頻通用智能底座,依托自主構建的SurgMotion-15M數據集完成訓練。該數據集涵蓋約1500萬幀、超過3658小時的真實手術視頻,覆蓋13個解剖區域、100余種臨床常見術式,其中心外科相關視頻時長超2860小時,是目前全球最大的同類型數據集。
基于這一海量臨床數據,SurgMotion突破了傳統像素級重建的技術局限,引入運動引導的隱空間預測機制,顯著提升了模型對手術器械、解剖結構、器械-組織交互動作等關鍵語義結構的理解能力,為多中心、多科室、多術式的通用手術智能奠定了核心基礎。
適配性仍是核心挑戰
AI賦能的手術機器人已成為整個外科賽道“數智化”升級的核心抓手,也被各大手術機器人廠商視為下一代技術競爭的核心高地。
葉小帆表示,參考汽車自動駕駛的分級邏輯,手術機器人的智能化可清晰劃分為5個等級,目前臨床落地進度差異顯著。
其中L1級基礎輔助已在臨床普及,核心是醫生全程操控手術機器人,系統僅提供單一維度的操作輔助,比如ROSA機械臂的精準立體定向功能,能在醫生的操控下,完成比人手更穩定的穿刺操作,尤其適配神經外科深部電極植入、腦活檢、立體定向腦電植入等對精度要求高的場景,核心價值是放大醫生的操作能力,增加手的穩定性,從而降低手術操作的物理門檻。
L2級作為進階輔助,已在多專科成熟落地,核心是系統可完成多個單一環節的自動化輔助。
比如達芬奇手術機器人的機械臂防抖、動作縮放、手術視野自動追蹤、器械自動對齊。醫生需全程控制器械移動與操作決策,但系統可自動完成“動作濾波(防抖)、比例縮放(精細操作)、器械關節自適應”,在神經外科內鏡經鼻垂體手術、腹腔鏡膽囊切除、骨科關節置換等標準化術式中應用廣泛,核心價值是減少醫生的重復操作,提升手術流程的規范性,但是在術中解剖結構自動識別方面仍有欠缺。
L3級能實現條件性自主操作,即僅在預設的、無意外的標準化手術場景中,機器人可自主完成特定的連續手術步驟,但一旦出現術中出血、解剖結構變異等突發情況,必須立即由醫生接管,系統無法自主決策處理。
在高復雜度、高個體化的神經外科手術中,L3級應用仍處于極早期的實驗室驗證階段,遠未達到臨床應用標準,如神經外科手術場景目前仍不可標準化——即使是同一種顱內腫瘤,不同患者的血管神經走行、腫瘤侵襲范圍差異極大,缺乏“預設的無意外場景”。
而L4-L5級可以實現高自主/全自主操作,但因手術場景的高度個體化、復雜性與不可預測性,目前僅停留在實驗室理論研究階段,短期內完全無法落地臨床。
“真正的全自主手術,核心難點不僅在于‘操作’,更在于‘決策’。”葉小帆說。目前廣泛使用的腦科機械臂有精準定位能力的“手”+基礎導航“透視眼”。它能基于術前影像規劃路徑,半自動完成空間定位(如電極植入點校準),但缺乏識別和理解手術流程的能力。SurgMotion這類模型的發布,雖增加了手術機器人的“感知與決策增強模塊”,做到精準識別和部分理解,但也還不是能夠決策的“大腦”。
劉宏斌表示,手術的智能化是未來趨勢,但目前的技術水平還遠無法滿足臨床的真實需求,面臨諸多核心挑戰。“手術本身是千人千面的,不同醫生的操作習慣存在巨大差異,患者的個體病情、解剖結構更是千差萬別,這要求AI必須具備極強的個性化適配能力。更重要的是,手術過程中會面臨很多突發并發癥等緊急情況,AI如何像頂尖臨床專家那樣,輔助醫生快速應對這些突發狀況,是目前亟待突破的技術瓶頸。”
在發布會現場,中國科學院香港創新研究院人工智能與機器人創新中心在發布“術影”SurgMotion手術視頻大模型的同時,也宣布了模型的全面開源計劃。
在葉小帆看來,該模型的開源將帶來三方面核心價值:打破技術壁壘、加速臨床落地、構建行業標準。
“目前醫療AI尤其是手術視頻大模型的研發,存在數據、算法、算力的三重門檻,很多基層醫院、中小型醫療科技企業甚至高校科研團隊,因缺乏核心模型參數,難以開展針對性的臨床適配性研究。”葉小帆說,單一研發團隊對臨床場景的理解始終是有限的,而開源后,全國乃至全球的臨床醫生、AI工程師,都能基于真實臨床需求對模型進行優化迭代。
“這種多場景、多學科的協同優化,會讓模型的臨床適配性提升速度遠快于閉門研發,大幅縮短從‘實驗室模型’到‘臨床輔助工具’的轉化周期。”葉小帆說,模型的開源還將為行業提供一套可參考的技術框架和評估體系,推動行業形成統一的研發規范和臨床驗證標準,也為手術機器人從L2向L3級的技術升級,提供核心的視頻理解與場景感知底座。
AI取代外科醫生進程仍漫長
AI正在重構未來的臨床診療模式和醫學研究范式,但關于“AI取代醫生”的討論,始終是行業繞不開的核心話題。
劉宏斌表示,外科醫生的日常工作,既是高強度的體力勞動,也是高復雜度的腦力勞動。未來,手術中重復的、標準化的體力操作,會逐步被AI輔助的機器人所替代,但這絕不意味著外科醫生會失業。“未來,外科醫生會更多地轉變為‘指揮家’的角色,主導人機協同的手術全流程,這很可能是未來外科醫生的核心競爭力之一。”
葉小帆則明確表示,馬斯克所說的“機器人醫生要幾年內徹底碾壓人類外科醫生”,從臨床實際來看是完全不可能的,甚至在未來十年內,都難以實現。
比如神經外科手術中,醫生需要根據患者顱內血管、神經走行的先天變異,實時調整手術入路與腫瘤切除范圍;面對術中突發的顱內大出血、血管痙攣等危急情況,醫生需要憑借數十年的臨床物理世界的理解和經驗,快速做出應急處理與決策調整。這些都是依賴大數據語言、視頻和算法的機器人難以實現的,因為臨床中的突發情況和個體化需求,尚無法完全量化和預設進算法模型中。
二是手術場景的復雜性和不確定性,遠超現有AI系統的處理能力。
三是醫療行業的特殊性,決定了技術替代的慢節奏。醫療行業直接關系到患者的生命安全,一項新技術的臨床應用,需要經過嚴格的倫理審查、多輪臨床試驗、國家監管部門的準入審批,以及長期的臨床安全性驗證,這一過程往往需要數年甚至數十年的時間。
“即使機器人醫生在虛擬場景和各實驗室中取得了不錯的成果,要實現臨床的廣泛應用,并達到‘碾壓人類外科醫生’的水平,還需要突破技術、倫理、法律、監管等多重障礙,這在短短幾年內是完全無法實現的。”葉小帆說,AI浪潮對醫療領域的重構,從來都不是簡單的“技術替代人”,而是“AI賦能醫療”——推動臨床診療從“經驗驅動”向“數據驅動”轉變,醫學研究從“試錯式探索”向“精準化預測”升級,而醫生的角色,也會從“單一的診療執行者”,轉變為“AI的駕馭者、臨床的決策者、醫療的創新者”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.