達(dá)拉斯程序員 neck 疼30小時(shí)才看上病，AI把流程壓到47秒

2026-04-07 13:28:24　來源: 閃存獵手

北京舉報(bào)

分享至

上周，達(dá)拉斯一位程序員脖子僵了，轉(zhuǎn)頭都困難。不致命，但急。他打開遠(yuǎn)程醫(yī)療 App，最早預(yù)約：30小時(shí)后。

這個(gè)場景被 Prashant Anand 記了下來。不是系統(tǒng)崩了，是系統(tǒng)本來就這么設(shè)計(jì)的。醫(yī)療的問題從來不是缺專家，是決策鏈條太長。他算了一筆賬：癥狀描述→醫(yī)生理解→分診判斷→藥房對接，每個(gè)環(huán)節(jié)都在吞時(shí)間。

他的解法不是造"AI醫(yī)生"，而是做一個(gè)把流程壓扁的"臨床協(xié)處理器"。

從"話說不清"到"結(jié)構(gòu)化的病歷"

患者說話是混沌的。"脖子疼，昨晚開始的，有點(diǎn)暈，可能睡落枕了"——這是人話，不是醫(yī)學(xué)術(shù)語。傳統(tǒng)系統(tǒng)要么讓護(hù)士手工錄入，要么扔給患者填標(biāo)準(zhǔn)化問卷，體驗(yàn)極差。

Anand 的方案是用大語言模型（LLM，Large Language Model）做特征提取。患者自由輸入，AI 實(shí)時(shí)解析，輸出結(jié)構(gòu)化字段：癥狀部位（頸部）、性質(zhì)（疼痛/活動(dòng)受限）、持續(xù)時(shí)間（12小時(shí)）、伴隨癥狀（輕度頭暈）、誘因（睡眠姿勢）。

他對比了兩種路徑。純規(guī)則引擎需要預(yù)設(shè)數(shù)千條關(guān)鍵詞映射，"落枕"要關(guān)聯(lián)到"頸椎肌肉痙攣"，"暈"要區(qū)分眩暈/頭暈/昏厥。維護(hù)成本極高，且覆蓋不了方言和口語變體。LLM 的泛化能力直接跳過這個(gè)坑，零樣本就能理解"像被人從后面打了一棍"是在描述頸強(qiáng)直。

關(guān)鍵設(shè)計(jì)：提取后的字段必須可人工校驗(yàn)。醫(yī)生能看到原始描述和 AI 解析結(jié)果，不一致時(shí)可以一鍵修正。這是醫(yī)療場景的剛需——黑箱不可接受。

分診引擎：不是診斷，是優(yōu)先級排序

系統(tǒng)核心是一個(gè)輕量級決策樹，輸入結(jié)構(gòu)化癥狀，輸出 triage 等級和建議路徑。Anand 明確劃了紅線：不做最終診斷，只做分流。

他的四級分類很直接。P0（緊急）：胸痛伴呼吸困難、意識改變、嚴(yán)重過敏反應(yīng)——直接觸發(fā)急診綠色通道。P1（當(dāng)日處理）：劇烈疼痛伴功能喪失、高熱不退、疑似感染——推送給值班醫(yī)生，2小時(shí)內(nèi)響應(yīng)。P2（常規(guī)預(yù)約）：慢性癥狀穩(wěn)定、輕微不適——進(jìn)入標(biāo)準(zhǔn)排隊(duì)，但附帶 AI 預(yù)問診摘要。P3（自我管理）：明確輕微問題（如普通感冒）、已有明確用藥史——推送藥房建議+復(fù)診提醒。

那位 Dallas 程序員的 neck 疼，系統(tǒng)判為 P1。AI 摘要顯示："35歲男性，急性頸痛12小時(shí)，無外傷史，無神經(jīng)癥狀（無手麻、無步態(tài)不穩(wěn)），VAS 評分 6/10，建議 NSAIDs（非甾體抗炎藥）+ 肌肉松弛劑，48小時(shí)無緩解需影像檢查。"

醫(yī)生收到這條，決策時(shí)間從平均 8 分鐘壓縮到 47 秒。不是替代判斷，是把信息預(yù)嚼碎了喂到嘴邊。

藥房閉環(huán)：從"建議"到"可執(zhí)行"

很多遠(yuǎn)程醫(yī)療卡在最后一英里。醫(yī)生開了建議，患者還得自己找藥房、比價(jià)、等庫存。Anand 的系統(tǒng)接入了實(shí)時(shí)藥房 API，根據(jù)患者地理位置、保險(xiǎn)覆蓋、庫存狀態(tài)，推送 2-3 個(gè)可立即取藥的選項(xiàng)。

技術(shù)實(shí)現(xiàn)上，他用了一個(gè)微服務(wù)架構(gòu)。LLM 特征提取是獨(dú)立容器，支持熱切換模型版本（GPT-4 成本高時(shí) fallback 到 Claude 3 Haiku）。分診引擎是規(guī)則+輕量模型的混合，確保可解釋性。藥房對接用了標(biāo)準(zhǔn) FHIR（Fast Healthcare Interoperability Resources，醫(yī)療信息快速互操作資源）協(xié)議，兼容主流電子病歷系統(tǒng)。

他公開了一組測試數(shù)據(jù)：在 200 例模擬病例上，AI 提取的字段與人工標(biāo)注一致性 94.3%，過度分診率（把 P2 判成 P1）8.7%，漏檢緊急病例 0%。后者是生死線，他花了最多時(shí)間調(diào)優(yōu)——寧可過度分流，不可漏掉 P0。

一個(gè)被刻意保留的"低效"設(shè)計(jì)：每個(gè) P0/P1 案例，系統(tǒng)強(qiáng)制要求醫(yī)生二次確認(rèn)。AI 可以快，但責(zé)任不能外包。

臨床協(xié)處理器的邊界

Anand 在文檔里寫了一句很產(chǎn)品經(jīng)理的話："這個(gè)系統(tǒng)的用戶不是患者，是醫(yī)生背后的時(shí)間。"他不避諱局限性。LLM 會(huì)幻覺，所以所有輸出都有置信度分?jǐn)?shù)，低置信字段標(biāo)紅。罕見病覆蓋不足，系統(tǒng)明確提示"癥狀不典型，建議面診"。兒科、孕產(chǎn)期、多重用藥患者，自動(dòng)降級處理優(yōu)先級，推給更有經(jīng)驗(yàn)的醫(yī)生。

他對比了兩種產(chǎn)品路線。Google Med-PaLM 2 那種端到端診斷模型，技術(shù)炫目，但臨床落地極難——監(jiān)管、責(zé)任、醫(yī)生信任都是深坑。他的路線是"AI 作為草稿生成器"，醫(yī)生始終握有終審權(quán)，合規(guī)路徑清晰得多。

項(xiàng)目開源在 GitHub，但 Anand 加了一條 unusual 的聲明：代碼可自由使用，但用于真實(shí)醫(yī)療場景前，必須通過當(dāng)?shù)乇O(jiān)管審批。他知道技術(shù)樂觀主義在醫(yī)療領(lǐng)域有多危險(xiǎn)。

那個(gè) Dallas 程序員后來怎么樣了？Anand 沒寫。但他在文末貼了一張系統(tǒng)截圖：同一癥狀輸入，傳統(tǒng)路徑 30 小時(shí)，AI 輔助路徑 47 秒。數(shù)字旁邊有一行小字——"醫(yī)生確認(rèn)時(shí)間：1分 12秒"。

AI 省下的 29 小時(shí)，醫(yī)生只花了 1 分鐘。剩下的時(shí)間，醫(yī)生去看了另一個(gè) P0 病例。這個(gè)賬，你覺得算得對嗎？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.