上周,達(dá)拉斯一位程序員脖子僵了,轉(zhuǎn)頭都困難。不致命,但急。他打開遠(yuǎn)程醫(yī)療 App,最早預(yù)約:30小時(shí)后。
這個(gè)場景被 Prashant Anand 記了下來。不是系統(tǒng)崩了,是系統(tǒng)本來就這么設(shè)計(jì)的。醫(yī)療的問題從來不是缺專家,是決策鏈條太長。他算了一筆賬:癥狀描述→醫(yī)生理解→分診判斷→藥房對接,每個(gè)環(huán)節(jié)都在吞時(shí)間。
他的解法不是造"AI醫(yī)生",而是做一個(gè)把流程壓扁的"臨床協(xié)處理器"。
從"話說不清"到"結(jié)構(gòu)化的病歷"
患者說話是混沌的。"脖子疼,昨晚開始的,有點(diǎn)暈,可能睡落枕了"——這是人話,不是醫(yī)學(xué)術(shù)語。傳統(tǒng)系統(tǒng)要么讓護(hù)士手工錄入,要么扔給患者填標(biāo)準(zhǔn)化問卷,體驗(yàn)極差。
Anand 的方案是用大語言模型(LLM,Large Language Model)做特征提取。患者自由輸入,AI 實(shí)時(shí)解析,輸出結(jié)構(gòu)化字段:癥狀部位(頸部)、性質(zhì)(疼痛/活動(dòng)受限)、持續(xù)時(shí)間(12小時(shí))、伴隨癥狀(輕度頭暈)、誘因(睡眠姿勢)。
他對比了兩種路徑。純規(guī)則引擎需要預(yù)設(shè)數(shù)千條關(guān)鍵詞映射,"落枕"要關(guān)聯(lián)到"頸椎肌肉痙攣","暈"要區(qū)分眩暈/頭暈/昏厥。維護(hù)成本極高,且覆蓋不了方言和口語變體。LLM 的泛化能力直接跳過這個(gè)坑,零樣本就能理解"像被人從后面打了一棍"是在描述頸強(qiáng)直。
關(guān)鍵設(shè)計(jì):提取后的字段必須可人工校驗(yàn)。醫(yī)生能看到原始描述和 AI 解析結(jié)果,不一致時(shí)可以一鍵修正。這是醫(yī)療場景的剛需——黑箱不可接受。
分診引擎:不是診斷,是優(yōu)先級排序
系統(tǒng)核心是一個(gè)輕量級決策樹,輸入結(jié)構(gòu)化癥狀,輸出 triage 等級和建議路徑。Anand 明確劃了紅線:不做最終診斷,只做分流。
他的四級分類很直接。P0(緊急):胸痛伴呼吸困難、意識改變、嚴(yán)重過敏反應(yīng)——直接觸發(fā)急診綠色通道。P1(當(dāng)日處理):劇烈疼痛伴功能喪失、高熱不退、疑似感染——推送給值班醫(yī)生,2小時(shí)內(nèi)響應(yīng)。P2(常規(guī)預(yù)約):慢性癥狀穩(wěn)定、輕微不適——進(jìn)入標(biāo)準(zhǔn)排隊(duì),但附帶 AI 預(yù)問診摘要。P3(自我管理):明確輕微問題(如普通感冒)、已有明確用藥史——推送藥房建議+復(fù)診提醒。
那位 Dallas 程序員的 neck 疼,系統(tǒng)判為 P1。AI 摘要顯示:"35歲男性,急性頸痛12小時(shí),無外傷史,無神經(jīng)癥狀(無手麻、無步態(tài)不穩(wěn)),VAS 評分 6/10,建議 NSAIDs(非甾體抗炎藥)+ 肌肉松弛劑,48小時(shí)無緩解需影像檢查。"
醫(yī)生收到這條,決策時(shí)間從平均 8 分鐘壓縮到 47 秒。不是替代判斷,是把信息預(yù)嚼碎了喂到嘴邊。
藥房閉環(huán):從"建議"到"可執(zhí)行"
很多遠(yuǎn)程醫(yī)療卡在最后一英里。醫(yī)生開了建議,患者還得自己找藥房、比價(jià)、等庫存。Anand 的系統(tǒng)接入了實(shí)時(shí)藥房 API,根據(jù)患者地理位置、保險(xiǎn)覆蓋、庫存狀態(tài),推送 2-3 個(gè)可立即取藥的選項(xiàng)。
技術(shù)實(shí)現(xiàn)上,他用了一個(gè)微服務(wù)架構(gòu)。LLM 特征提取是獨(dú)立容器,支持熱切換模型版本(GPT-4 成本高時(shí) fallback 到 Claude 3 Haiku)。分診引擎是規(guī)則+輕量模型的混合,確保可解釋性。藥房對接用了標(biāo)準(zhǔn) FHIR(Fast Healthcare Interoperability Resources,醫(yī)療信息快速互操作資源)協(xié)議,兼容主流電子病歷系統(tǒng)。
他公開了一組測試數(shù)據(jù):在 200 例模擬病例上,AI 提取的字段與人工標(biāo)注一致性 94.3%,過度分診率(把 P2 判成 P1)8.7%,漏檢緊急病例 0%。后者是生死線,他花了最多時(shí)間調(diào)優(yōu)——寧可過度分流,不可漏掉 P0。
一個(gè)被刻意保留的"低效"設(shè)計(jì):每個(gè) P0/P1 案例,系統(tǒng)強(qiáng)制要求醫(yī)生二次確認(rèn)。AI 可以快,但責(zé)任不能外包。
臨床協(xié)處理器的邊界
Anand 在文檔里寫了一句很產(chǎn)品經(jīng)理的話:"這個(gè)系統(tǒng)的用戶不是患者,是醫(yī)生背后的時(shí)間。"他不避諱局限性。LLM 會(huì)幻覺,所以所有輸出都有置信度分?jǐn)?shù),低置信字段標(biāo)紅。罕見病覆蓋不足,系統(tǒng)明確提示"癥狀不典型,建議面診"。兒科、孕產(chǎn)期、多重用藥患者,自動(dòng)降級處理優(yōu)先級,推給更有經(jīng)驗(yàn)的醫(yī)生。
他對比了兩種產(chǎn)品路線。Google Med-PaLM 2 那種端到端診斷模型,技術(shù)炫目,但臨床落地極難——監(jiān)管、責(zé)任、醫(yī)生信任都是深坑。他的路線是"AI 作為草稿生成器",醫(yī)生始終握有終審權(quán),合規(guī)路徑清晰得多。
項(xiàng)目開源在 GitHub,但 Anand 加了一條 unusual 的聲明:代碼可自由使用,但用于真實(shí)醫(yī)療場景前,必須通過當(dāng)?shù)乇O(jiān)管審批。他知道技術(shù)樂觀主義在醫(yī)療領(lǐng)域有多危險(xiǎn)。
那個(gè) Dallas 程序員后來怎么樣了?Anand 沒寫。但他在文末貼了一張系統(tǒng)截圖:同一癥狀輸入,傳統(tǒng)路徑 30 小時(shí),AI 輔助路徑 47 秒。數(shù)字旁邊有一行小字——"醫(yī)生確認(rèn)時(shí)間:1分 12秒"。
AI 省下的 29 小時(shí),醫(yī)生只花了 1 分鐘。剩下的時(shí)間,醫(yī)生去看了另一個(gè) P0 病例。這個(gè)賬,你覺得算得對嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.