
來源 | 醫(yī)脈通精神科
醫(yī)脈通導(dǎo)讀
總體來看,AI 在精神科最成熟、最具前景的應(yīng)用集中于復(fù)雜數(shù)據(jù)分析,以支持篩查、治療結(jié)局預(yù)測(cè)和風(fēng)險(xiǎn)監(jiān)測(cè)。然而,方法學(xué)缺陷、外部驗(yàn)證不足、模型不透明及倫理風(fēng)險(xiǎn)仍嚴(yán)重制約其進(jìn)入臨床。
當(dāng)前證據(jù)一致表明,AI 應(yīng)被視為輔助工具,而非替代臨床判斷或人類治療的手段。未來亟需在多樣化人群中開展設(shè)計(jì)嚴(yán)謹(jǐn)、多中心、前瞻性的 RCT,并同步建立針對(duì)安全性、偏見和可解釋性的監(jiān)管框架。
在「技術(shù)已被廣泛使用」的現(xiàn)實(shí)背景下,問題已不再是用不用 AI,而是如何在循證醫(yī)學(xué)與倫理原則指導(dǎo)下,最大化其潛在益處、最小化其可能危害。
精神疾病造成了沉重的全球疾病負(fù)擔(dān),但能夠獲得及時(shí)、有效精神衛(wèi)生服務(wù)的人群仍然有限。傳統(tǒng)精神科診療高度依賴主觀訪談與量表評(píng)估,藥物治療多采取「試錯(cuò)」策略,而循證心理治療在現(xiàn)實(shí)世界中長期面臨可及性不足的問題。在此背景下,如何在擴(kuò)大服務(wù)規(guī)模的同時(shí)維持乃至提升治療質(zhì)量與個(gè)體化水平,已成為精神衛(wèi)生體系的核心挑戰(zhàn)。
近年來,人工智能(AI),尤其是機(jī)器學(xué)習(xí)(ML)與自然語言處理(NLP)的快速發(fā)展,為精神科診療流程的重構(gòu)提供了新的技術(shù)工具。AI 模型可以整合并分析多源數(shù)據(jù),包括傳統(tǒng)問卷、電子健康記錄(EHR)、數(shù)字表型(digital phenotyping, DP)、語音特征、可穿戴設(shè)備與智能手機(jī)的被動(dòng)數(shù)據(jù)等,從而在篩查、治療決策、風(fēng)險(xiǎn)預(yù)測(cè)和心理治療支持等多個(gè)環(huán)節(jié)展現(xiàn)潛在價(jià)值。然而,盡管相關(guān)研究數(shù)量迅速增長,其真實(shí)世界臨床效用、最佳應(yīng)用場(chǎng)景以及倫理與安全問題仍存在顯著爭議。
![]()
本文基于一項(xiàng)近期發(fā)表于
Current Psychiatry Reports 的敘述性綜述,系統(tǒng)梳理了近五年 AI 在精神科個(gè)體化治療中的主要進(jìn)展,重點(diǎn)圍繞四個(gè)關(guān)鍵領(lǐng)域展開:1. 篩查;2. 治療計(jì)劃與治療反應(yīng)預(yù)測(cè);3. 復(fù)發(fā)與風(fēng)險(xiǎn)預(yù)測(cè)及早期干預(yù);4. 心理治療。通過綜合現(xiàn)有證據(jù),本文旨在為臨床醫(yī)生與研究者提供一個(gè)更為審慎、現(xiàn)實(shí)的整體判斷。
篩查:從問卷到數(shù)字表型
精神科護(hù)理的第一道瓶頸在于篩查與初始評(píng)估。專業(yè)人員短缺、需求增長以及結(jié)構(gòu)化訪談和量表評(píng)估的耗時(shí)性,導(dǎo)致大量患者難以及時(shí)進(jìn)入診療流程。此外,自評(píng)工具易受回憶偏倚和主觀因素影響,往往難以捕捉癥狀的動(dòng)態(tài)變化。
AI 介入篩查的初衷在于減輕臨床負(fù)擔(dān)并擴(kuò)大服務(wù)覆蓋面。早期研究多聚焦于對(duì)傳統(tǒng)問卷數(shù)據(jù)的高級(jí)分析、通過 ML 精簡量表?xiàng)l目或自動(dòng)化評(píng)分。這類方法在技術(shù)上相對(duì)成熟,但本質(zhì)仍依賴自評(píng)數(shù)據(jù),其邊際增益有限。
更具吸引力的是將 ML 應(yīng)用于混合數(shù)據(jù)源。已有研究利用人口學(xué)特征、生活方式和睡眠指標(biāo)構(gòu)建預(yù)測(cè)模型,在大學(xué)生樣本中實(shí)現(xiàn)了較高的抑郁與焦慮癥狀識(shí)別性能,并提示睡眠質(zhì)量是關(guān)鍵風(fēng)險(xiǎn)因子。然而,這類模型往往針對(duì)特定人群開發(fā),其泛化能力仍需謹(jǐn)慎評(píng)估。
NLP 為篩查提供了另一條路徑。研究表明,語言特征可用于區(qū)分患者與健康對(duì)照,并識(shí)別抑郁或精神病性障礙的潛在標(biāo)記。但這些模型在更大、異質(zhì)人群中的穩(wěn)定性尚不明確。近年來,基于大語言模型(LLM)的會(huì)話代理開始被用于精神衛(wèi)生自我轉(zhuǎn)診和初篩。英國真實(shí)世界研究顯示,AI 自我轉(zhuǎn)診聊天機(jī)器人顯著提高了轉(zhuǎn)診總量,且在非二元性別者和少數(shù)族裔人群中的增幅尤為明顯,提示其可能在降低污名和改善準(zhǔn)入方面具有獨(dú)特價(jià)值。
EHR 也是 AI 篩查的重要數(shù)據(jù)來源。通過對(duì)臨床文本的實(shí)時(shí)分析,AI 模型可用于識(shí)別阿片類藥物使用障礙等高風(fēng)險(xiǎn)狀態(tài),并提示進(jìn)一步干預(yù)。然而,這類系統(tǒng)的臨床整合方式、工作流影響以及真實(shí)結(jié)局改善效果,仍缺乏充分的驗(yàn)證。
數(shù)字表型方法代表了更具前瞻性的方向。智能手機(jī)和可穿戴設(shè)備生成的行為與生理數(shù)據(jù),使在自然環(huán)境中持續(xù)監(jiān)測(cè)成為可能。研究已發(fā)現(xiàn),活動(dòng)模式、睡眠不規(guī)律性與焦慮或抑郁癥狀密切相關(guān),并可用于構(gòu)建早期風(fēng)險(xiǎn)評(píng)分。然而,系統(tǒng)綜述顯示,DP 模型普遍存在外部驗(yàn)證不足、數(shù)據(jù)缺失處理能力弱以及跨人群性能下降的問題。更重要的是,某些行為指標(biāo)在不同人口學(xué)亞組中的意義甚至方向可能相反。
總體而言,AI 篩查領(lǐng)域已證明「可行性」,但仍處于早期階段。混合式路徑,如先基于被動(dòng)數(shù)據(jù)進(jìn)行初篩,再通過簡短的聊天機(jī)器人或問卷確認(rèn),有望在靈敏度與特異度之間取得更現(xiàn)實(shí)的平衡,但其臨床后果仍需前瞻性研究評(píng)估。
治療計(jì)劃與治療反應(yīng)預(yù)測(cè)
個(gè)體化治療是精準(zhǔn)精神醫(yī)學(xué)的核心目標(biāo)之一。AI 驅(qū)動(dòng)的決策支持系統(tǒng)嘗試通過整合遺傳、生物學(xué)和臨床數(shù)據(jù),預(yù)測(cè)患者對(duì)特定干預(yù)的反應(yīng)概率,從而輔助治療選擇。
在藥物治療領(lǐng)域,已有研究利用大規(guī)模 EHR 和 NLP 技術(shù),預(yù)測(cè)患者對(duì)不同抗抑郁藥物類別(SSRIs、SNRIs、安非他酮、米氮平)的反應(yīng),并輸出個(gè)體化概率及關(guān)鍵的療效驅(qū)動(dòng)因素。其他研究結(jié)合遺傳和人口學(xué)特征,取得了中等水平的預(yù)測(cè)準(zhǔn)確性,但在外部數(shù)據(jù)集中性能下降明顯,凸顯出外推性的不足。
在心理治療領(lǐng)域,ML 模型被用于預(yù)測(cè)特定治療(如 CBT 或問題解決治療)的緩解可能性。盡管部分模型在內(nèi)部驗(yàn)證中表現(xiàn)尚可,但大多缺乏外部復(fù)制,也尚未證明其在臨床實(shí)踐中能否真正改善結(jié)局。
值得注意的是,已有少數(shù)模型進(jìn)入隨機(jī)對(duì)照試驗(yàn)階段。分層護(hù)理模式中,利用 ML 預(yù)測(cè)將患者直接匹配至最可能獲益的治療強(qiáng)度,較傳統(tǒng)階梯式護(hù)理顯示出更高的抑郁緩解率,但同時(shí)也增加了初始資源投入,提示系統(tǒng)層面的容量調(diào)整不可或缺。
作者團(tuán)隊(duì)自身開展的研究進(jìn)一步表明,在提供 AI 預(yù)測(cè)結(jié)果的同時(shí),結(jié)合可視化問卷反饋和操作化指南的臨床決策支持系統(tǒng),可能優(yōu)于單純反饋信息的對(duì)照模式。盡管樣本量有限,這類研究為 AI 輔助決策的臨床價(jià)值提供了初步證據(jù)。
與此形成對(duì)比的是,生成式模型在治療計(jì)劃制定中的表現(xiàn)仍令人擔(dān)憂。多項(xiàng)研究發(fā)現(xiàn),LLM 在生成精神科治療計(jì)劃時(shí)存在與指南沖突的錯(cuò)誤,并對(duì)人為的提示高度敏感。這意味著當(dāng)前的生成式模型不宜被用于自主制定治療方案。
風(fēng)險(xiǎn)預(yù)測(cè)與復(fù)發(fā)預(yù)防
1. 一級(jí)預(yù)防:疾病發(fā)生風(fēng)險(xiǎn)預(yù)測(cè)
AI 被廣泛探索用于預(yù)測(cè)精神障礙的發(fā)生或轉(zhuǎn)化風(fēng)險(xiǎn)。基于 EHR 的模型已被用于預(yù)測(cè)向精神分裂癥或雙相障礙的長期轉(zhuǎn)化概率;多模態(tài)研究則將臨床、神經(jīng)認(rèn)知、影像和多基因風(fēng)險(xiǎn)評(píng)分相結(jié)合,在臨床高風(fēng)險(xiǎn)人群中取得了中等至較高的敏感性。
值得強(qiáng)調(diào)的是,將算法預(yù)測(cè)與臨床醫(yī)生判斷相結(jié)合,可顯著提升整體性能,提示 AI 在此階段更適合作為輔助而非替代工具。
2. 二級(jí)預(yù)防:復(fù)發(fā)預(yù)測(cè)與持續(xù)監(jiān)測(cè)
在復(fù)發(fā)預(yù)防方面,AI 的潛力主要體現(xiàn)在縱向監(jiān)測(cè)。基于智能手機(jī) DP 的異常檢測(cè)已被用于識(shí)別精神分裂癥、抑郁癥和雙相障礙的早期惡化信號(hào)。可穿戴設(shè)備與視頻分析的多模態(tài)方法,也可捕捉預(yù)測(cè)復(fù)發(fā)的生理與行為標(biāo)志。
EHR 驅(qū)動(dòng)的風(fēng)險(xiǎn)預(yù)測(cè)模型能夠在臨床實(shí)踐中持續(xù)評(píng)估短期危機(jī)風(fēng)險(xiǎn)。盡管部分模型具有較高特異度,但敏感性不足仍是突出問題。前瞻性研究顯示,臨床醫(yī)生在一定比例的病例中認(rèn)為這些預(yù)測(cè)有助于優(yōu)先分配資源,但其對(duì)總體結(jié)局的影響仍有限。
心理治療與會(huì)話代理
AI 在心理治療中最近、最重要的應(yīng)用是使用會(huì)話代理或聊天機(jī)器人提供精神衛(wèi)生支持。這些聊天機(jī)器人通常基于認(rèn)知行為治療(CBT)的原則,并在患者群體、大學(xué)生和跨文化背景中展示出可行性。與人類治療師不同,AI 提供持續(xù)、按需且私密的互動(dòng),不受排班限制,一些人認(rèn)為其帶來的污名也更少。此外,它們或許可以讓人類臨床醫(yī)生能夠?qū)W⒂诟鼜?fù)雜的病例。
數(shù)量不多但日益增加的 RCT 為 AI 聊天機(jī)器人用于療法交付的效用提供了初步實(shí)證證據(jù)。然而在這些 RCT 中,對(duì)照組均未包含由人類治療師提供的活性治療,而是采用了等候名單或信息提供對(duì)照組,且研究人員和參與者均未設(shè)盲,這嚴(yán)重限制了可以從這些研究中得出的結(jié)論。
一旦將 AI 聊天機(jī)器人與傳統(tǒng)的人類治療師進(jìn)行比較,結(jié)果則更為平淡。這些發(fā)現(xiàn)表明聊天機(jī)器人可以提供可及的支持,尤其是當(dāng)沒有人類治療師可用時(shí),但它們的益處可能無法等同由人類治療師帶來的獲益。
我們認(rèn)為,聊天機(jī)器人提供某些價(jià)值的證明創(chuàng)造了一種潛在的道德風(fēng)險(xiǎn)。為了向等候名單上的人員提供「總比沒有好」的服務(wù),可能會(huì)急于部署這些系統(tǒng)。雖然安全地使用聊天機(jī)器人可以合理地補(bǔ)充醫(yī)療缺口,但這樣做可能影響「治本」。因此,雖然基于當(dāng)前技術(shù)的 AI 聊天機(jī)器人最終可能會(huì)在分層治療階梯的較低層級(jí)占據(jù)一席之地,但目前不應(yīng)將其解讀為對(duì)人類提供治療需求的解決方案。
臨床背景外的 LLM 使用問題
在臨床背景之外,ChatGPT 等工具已被數(shù)百萬尋求情感支持的用戶非正式地使用。案例研究描述了用戶針對(duì)從哀傷到管理 ADHD 癥狀等多樣化的心理需求與 ChatGPT 互動(dòng),并報(bào)告舒適度和即時(shí)性為益處。一些研究甚至表明,ChatGPT-4 可以生成足以與人類心理學(xué)家媲美的社交智能反應(yīng)。
然而,此類發(fā)現(xiàn)應(yīng)極其謹(jǐn)慎地解讀,因?yàn)楹芏啻祟愌芯渴褂玫氖菢?biāo)準(zhǔn)化任務(wù)或案例片段,這并不等同于實(shí)際治療中的復(fù)雜案例和情感共鳴。此外,AI 的持續(xù)可用性和非評(píng)判性語氣可能會(huì)正向強(qiáng)化使用(并可能過度使用),導(dǎo)致情感依賴,并違背對(duì)康復(fù)至關(guān)重要的治療邊界。事實(shí)上,人們發(fā)現(xiàn) AI 的反應(yīng)如此討人喜歡,這一事實(shí)本身可能是一個(gè)關(guān)于其在治療背景下潛在缺乏有效性的擔(dān)憂信號(hào)——患者有時(shí)需要聽到或感受到那些為了痊愈而必須立即面對(duì)的事情。未來需要開展 RCT 以及進(jìn)行更詳盡的定性工作,以更好地理解 AI 在非臨床背景下的潛在作用,以及至關(guān)重要的安全性。
安全顧慮仍然重大。事實(shí)上,聊天機(jī)器人已經(jīng)與多起自殺案例和精神病惡化聯(lián)系在了一起。此外,最近對(duì) Replika(一種情感支持生成式 AI 聊天機(jī)器人)用戶報(bào)告的大規(guī)模內(nèi)容分析中,人們發(fā)現(xiàn)了大量未經(jīng)請(qǐng)求的性內(nèi)容和邊界侵犯實(shí)例,引起了用戶的困擾和恐懼。最后,公開可用的模型被發(fā)現(xiàn)未能尋求適當(dāng)?shù)谋尘靶畔ⅲ峁┻^度指示性的干預(yù),并在危機(jī)情況下反應(yīng)無效。倫理和文化偏見也是一個(gè)擔(dān)憂。聊天機(jī)器人在被視為可靠的治療伙伴之前,應(yīng)在訓(xùn)練過程中接受嚴(yán)格監(jiān)督,并進(jìn)行文化適應(yīng)和外傷知情的保障。
考慮到這一背景,令人驚訝的是政府機(jī)構(gòu)竟然允許 ChatGPT 這種形式的聊天機(jī)器人發(fā)布,而沒有像對(duì)任何其他醫(yī)療器械那樣進(jìn)行同樣的嚴(yán)格測(cè)試和安全檢查。鑒于公眾已經(jīng)在出于醫(yī)療原因使用它們,我們認(rèn)為結(jié)果顯然是可以預(yù)見的。
為評(píng)估 AI 真正的臨床價(jià)值,必須將它們與現(xiàn)實(shí)的替代方案(如循證自助資源和數(shù)字工作手冊(cè))進(jìn)行比較。只有通過此類比較,我們才能評(píng)估聊天機(jī)器人是切實(shí)地?cái)U(kuò)大了準(zhǔn)入,還是僅僅以一種技術(shù)上更吸引人的形式重新包裝了現(xiàn)有的治療內(nèi)容。
討論與結(jié)論
總體來看,AI 在精神科中最成熟、最具前景的應(yīng)用集中于復(fù)雜數(shù)據(jù)分析,場(chǎng)景包括支持篩查、治療結(jié)局預(yù)測(cè)和風(fēng)險(xiǎn)監(jiān)測(cè)。然而,方法學(xué)缺陷、外部驗(yàn)證不足、模型不透明及倫理風(fēng)險(xiǎn)仍嚴(yán)重制約其進(jìn)入臨床(表1)。
表1 核心發(fā)現(xiàn)總結(jié)
![]()
當(dāng)前證據(jù)一致表明,AI 應(yīng)被視為輔助工具,而非替代臨床判斷或人際治療的手段。未來亟需在多樣化人群中開展設(shè)計(jì)嚴(yán)謹(jǐn)、多中心、前瞻性的 RCT,并同步建立針對(duì)安全性、偏見和可解釋性的監(jiān)管框架。
在「技術(shù)已被廣泛使用」的現(xiàn)實(shí)背景下,問題已不再是是否使用 AI,而是如何在循證醫(yī)學(xué)與倫理原則指導(dǎo)下,最大化其潛在益處、最小化其可能危害。
信源:Jalali S, You Q, Xu V, et al. The Use of Artificial Intelligence for Personalized Treatment in Psychiatry. Curr Psychiatry Rep. 2025 Dec 29;28(1):7. doi: 10.1007/s11920-025-01656-y. PMID: 41457119.
責(zé)編|Zelda
封面圖來源|視覺中國
進(jìn)一步推廣三明醫(yī)改經(jīng)驗(yàn)!國家衛(wèi)健委:這類人員待遇有保證了 | 醫(yī)脈政事兒
67歲患者胸痛伴劇烈頭暈氣促,是心臟問題還是另有隱情?丨醫(yī)起推理吧
醫(yī)脈通是專業(yè)的在線醫(yī)生平臺(tái),“感知世界醫(yī)學(xué)脈搏,助力中國臨床決策”是平臺(tái)的使命。醫(yī)脈通旗下?lián)碛小概R床指南」「用藥參考」「醫(yī)學(xué)文獻(xiàn)王」「醫(yī)知源」「e研通」「e脈播」等系列產(chǎn)品,全面滿足醫(yī)學(xué)工作者臨床決策、獲取新知及提升科研效率等方面的需求。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.