![]()
圖源:Pixabay
編者按
- 抑郁癥正在向低齡化蔓延,這已是全球共識。但在中國,當(dāng)我們試圖看清這一現(xiàn)象時(shí),卻常常陷入迷霧:中國孩子的抑郁檢出率,數(shù)據(jù)為何總是“打架”?
- 《知識分子》曾在過往的報(bào)道中指出一個(gè)令人困惑的現(xiàn)象:不同研究中,中國兒童青少年的抑郁患病率竟從 4% 跨越到了 41%。(見《知識分子》往期推送:在精神科門診里,孩子們的年紀(jì)越來越小)這種巨大的數(shù)據(jù)鴻溝,連在中國研究自殺問題38年的精神科專家費(fèi)立鵬都曾直言:“數(shù)據(jù)的可靠性沒那么高。”
- 問題究竟出在哪里?
- 這一次,來自南京師范大學(xué)與某三甲醫(yī)院心理門診的研究團(tuán)隊(duì)揭開了一個(gè)被忽視的真相:我們可能正在用“錯(cuò)誤的尺子”衡量中國的孩子。
- 研究發(fā)現(xiàn),現(xiàn)有的測量量表宛如“盲人摸象”——沒有一個(gè)癥狀出現(xiàn)在所有量表中;也沒有任何一個(gè)量表測量到了所有的癥狀。甚至,即便同一個(gè)孩子,在這張問卷上被判定為抑郁,換一張問卷可能就是“正常”。我們長期依賴成人的標(biāo)準(zhǔn)、西方的量表,卻唯獨(dú)缺少一把專屬于中國青少年的精準(zhǔn)“尺子”。
- 如果連刻度都是模糊的,我們該如何守護(hù)下一代的心理健康?這并非杞人憂天,而是基于嚴(yán)謹(jǐn)數(shù)據(jù)的追問。以下是幾位學(xué)者的研究發(fā)現(xiàn):
撰文|胡傳鵬、汪浩遠(yuǎn)
責(zé)編 | 李珊珊
抑郁已成為困擾兒童與青少年的主要心理健康問題。全球約90%的青少年生活在發(fā)展中國家,而他們的抑郁檢出率正在快速上升。最近一次系統(tǒng)回顧和薈萃分析也顯示大約五分之一的兒童青少年目前經(jīng)歷抑郁或報(bào)告抑郁癥狀(Lu et al., 2024)。這些數(shù)據(jù),以及其他的心理健康問題的數(shù)據(jù)一起,使得青少年心理健康,尤其是抑郁問題成為全社會(huì)關(guān)注的問題。
解決問題的第一步是科學(xué)地評估,也就是:以什么標(biāo)準(zhǔn)判斷一個(gè)人是否抑郁?這個(gè)非常重要的問題,卻往往經(jīng)常被忽視,尤其是在青少年抑郁的語境中。許多大規(guī)模調(diào)查的結(jié)果在朋友圈廣泛傳播時(shí),卻很難找到這些調(diào)查中用來判斷抑郁的標(biāo)準(zhǔn)是什么。
為了了解這個(gè)問題,我們對最近一些大規(guī)模調(diào)查中使用的抑郁篩查工作進(jìn)行了探索。我們發(fā)現(xiàn),臨床篩查和大型流行病學(xué)調(diào)查均依賴由被調(diào)查者報(bào)告的抑郁量表,且不同的調(diào)查中使用的問卷可能不盡相同。例如總樣本高達(dá)19萬多的《中國國民心理健康發(fā)展報(bào)告》藍(lán)皮書采用的方式是《簡版流調(diào)中心抑郁量表(CESD-9)》(傅小蘭, 張侃, 2023);共抽取 23個(gè)省、5個(gè)自治區(qū)、4個(gè)直轄市包含了共4萬多樣本的中國居民心理與行為調(diào)查研究采用的方式是《患者健康問卷(PHQ-9)》(榮麗敏 等, 2023)。一個(gè)問題浮現(xiàn)了:這些用來測量抑郁的不同“尺子”,它們測量的是同一個(gè)東西嗎?
為了回答這個(gè)問題,我們團(tuán)隊(duì)進(jìn)行了一項(xiàng)系統(tǒng)性的研究,首次在中國文化背景下,全面審視了用于兒童青少年的抑郁量表(見文末的預(yù)印本)。結(jié)果發(fā)現(xiàn),這些“尺子”之間的差異之大,遠(yuǎn)超我們最初的預(yù)期,不同的抑郁問卷測量的可能不是同一個(gè)東西。
01 沒有一個(gè)癥狀出現(xiàn)在所有兒童抑郁量表中,也沒有任何一個(gè)量表測量到了所有的癥狀
為了搞清楚當(dāng)前至少有多少個(gè)抑郁量表用于測量兒童青少年的抑郁,我們進(jìn)行了一次大規(guī)模的“學(xué)術(shù)摸底”工作。
第一步:海選。我們在四項(xiàng)覆蓋小學(xué)生至大學(xué)生心理健康檢出率的薈萃分析研究中,提取了441篇涉及到抑郁檢出率的學(xué)術(shù)論文(陳雨濛 等, 2022; 黃瀟瀟 等, 2022; 于曉琪 等, 2022; 張亞利 等, 2022, 非常感謝作者們分享了他們的薈萃分析數(shù)據(jù)!), 從這些論文中找出其用于評估抑郁的工具。在這一步中,我們共找到了33個(gè)獨(dú)特的量表。第二步:篩選。我們篩選每個(gè)量表中最權(quán)威的版本。例如,當(dāng)一個(gè)量表有多個(gè)中文翻譯時(shí),優(yōu)先選用更新的、更準(zhǔn)確的、以及信息更完整的中文版本。
最終,我們能夠找到27個(gè)量表的完整題目,它們是本次研究的對象。這其中不乏一些公眾熟知或官方推薦的量表,例如:被最新版《中國抑郁障礙防治指南》推薦使用的《患者健康問卷(PHQ-9)》,這里也包括一些中國學(xué)者自主開發(fā)的量表。
我們對這27個(gè)量表的385個(gè)條目進(jìn)行了精細(xì)的“編碼”工作,試圖找出它們用于評估抑郁的細(xì)分標(biāo)準(zhǔn)。如果兩個(gè)題目測量的是同一個(gè)抑郁的癥狀,則我們將它合并。經(jīng)過幾輪編碼與討論,我們發(fā)現(xiàn)這27個(gè)量表的385個(gè)條目共測量了 84個(gè) 彼此不同的癥狀(見圖1)。
值得的注意的是:沒有一個(gè)癥狀出現(xiàn)在所有量表中;也沒有任何一個(gè)量表測量到了所有的癥狀。這意味著,每份量表都像在描繪抑郁的不同方面,沒有任何一份能囊括全貌, 這些量表放在一起,呈現(xiàn)出了一種盲人摸象的即視感。
![]()
圖1. 二十七個(gè)量表的內(nèi)容重疊
每行是一個(gè)癥狀,每列是一份量表。一條橫線上有多個(gè)點(diǎn),這意味著這個(gè)癥狀出現(xiàn)在多個(gè)量表中。紅色為年齡特異項(xiàng),藍(lán)色為文化特異項(xiàng)。可以看到大量“只出現(xiàn)一次”的獨(dú)特癥狀。
然而,比“有什么”更觸目驚心的是“沒什么”——這些量表之間嚴(yán)重缺乏一致性。 為了定量比較這些量表的重合度,我們計(jì)算了它們的重合度指數(shù)(Jaccard系數(shù))。結(jié)果如圖2所示。所有量表之間的平均重合度低至0.19,中位數(shù)僅為0.17,且四分位距(IQR)為0.11至0.25(見圖3)。這意味著,大部分量表之間的共同之處少得可憐,不同的量表雖然都聲稱自己測量的是抑郁,但是很有可能一個(gè)學(xué)生在量表 A 上被評為“抑郁”,在量表 B 上卻完全被評為“正常”。從研究角度看,不同抑郁量表并不能互換使用,對抑郁研究的可復(fù)制性和普遍性造成了威脅。
![]()
圖2. 二十七個(gè)抑郁量表?xiàng)l目之間的重合度指數(shù)
![]()
圖3.展示了所有抑郁量表之間重合度(Jaccard指數(shù))的分布。分布呈右偏(眾數(shù) = 0.13,中位數(shù) = 0.17,IQR = 0.11–0.25),表明大多數(shù)量表之間僅存在較小比例的癥狀重疊,僅有少量量表組合表現(xiàn)出中度或較高重疊。
02 被忽略的“角落”:文化與年齡的特異性癥狀
已經(jīng)有不少研究表明,抑郁等心理健康問題,其癥狀可能會(huì)受到文化的影響,例如:擔(dān)憂(worry)在南亞和東南亞中更常見,而想的太多(thinking too much)在東南亞和撒哈拉以南非洲人口中更為常見(Haroz et al., 2017)。同時(shí),抑郁在不同年齡階段也可能有巨大的差異。例如,植物性癥狀(Vegetative symptoms)、食欲變化(appetite change)和體重變化(weight change)、能量喪失(loss of energy)和失眠(insomnia)在青少年重度抑郁癥患者中比成人更常見。快感缺乏(Anhedonia)/興趣喪失(loss of interest)和注意力集中問題(concentration problems)在成年重度抑郁癥患者中更為常見(Rice et al., 2019)。
那么對于中國兒童青少年的抑郁測量中,有多少癥狀考慮到了文化與年齡段的特殊性呢?這個(gè)結(jié)果并不樂觀:只有少量中國學(xué)者自主研發(fā)的量表有少量的文化特異性的癥狀。同樣,只有少量專門為兒童青少年設(shè)計(jì)的量表才包含 “年齡特異性癥狀”。在全部27個(gè)量表中,僅有8個(gè)量表關(guān)注了年齡的特點(diǎn)特性,更是只有4個(gè)量表,關(guān)注到了文化的特性。
換句話說,我們可能是在“用西方成人尺子量中國孩子”。回到最初那四百多篇關(guān)于抑郁檢出率的文章,他們明確聚焦于從小學(xué)到大學(xué)的中國學(xué)生群體,但使用頻率高的量表卻是為成人設(shè)計(jì)的工具。其中使用最廣的(在441項(xiàng)研究中出現(xiàn)了129次),是由美國杜克大學(xué)教授William W.K. Zung在1965年開發(fā)的《宗氏抑郁自評量表(SDS)》(Zung, 1965),其適用于具有抑郁癥狀的成年人。排名其次的是由Leonard R. Derogatis于1973年編制的《癥狀自評量表(SCL-90)》(Derogatis et al., 1973),這一量表適用于精神科或非精神科的成年門診病人,出現(xiàn)了113次 。
03 假如我們用四個(gè)抑郁問卷測量同一批人,會(huì)出現(xiàn)什么結(jié)果?
為了檢驗(yàn)問卷內(nèi)容上的差異是否會(huì)導(dǎo)致它們在篩檢時(shí)出現(xiàn)不同的結(jié)果,我們進(jìn)一步分析來自北京某醫(yī)院近1.25萬名7-18歲青少年的數(shù)據(jù),這些孩子均完成了四個(gè)常用量表:《兒童抑郁障礙自評量表(DSRSC)》;《患者健康問卷(PHQ-9)》; 《抑郁-焦慮-壓力自評量表(DASS-21)》;《兒童抑郁量表(CDI)》。
結(jié)果發(fā)現(xiàn)檢出率之間的差異確實(shí)存在:對于同一批孩子,四個(gè)量表的抑郁檢出率從49.25%到62.43%不等(見圖4A)。雖然四個(gè)量表均會(huì)將一批人識別為抑郁,但同樣值得注意的是:每個(gè)量表都找到了一批“獨(dú)特”的抑郁者,例如:有833個(gè)孩子僅被DASS-21量表判定為抑郁,而其他量表則認(rèn)為他們“正常”(見圖4B)。這印證了我們擔(dān)心的問題:同一個(gè)人在不同問卷上可能從“抑郁”變成“不抑郁”。
![]()
圖4. 四個(gè)自評量表對同一人群的抑郁檢出率。不同顏色的柱子清晰顯示,DASS-21的檢出率最高,而CDI的檢出率最低。3B展示了被不同量表組合識別出的患者分布。最淺色的區(qū)域代表僅被一個(gè)量表識別出的“獨(dú)特”患者,面積巨大,尤其是僅被DASS-21識別的人群(833人),說明不同量表捕捉的是不盡相同的群體。
在追溯這些量表的過程中,我們還遇到了一些令人啼笑皆非的“尷尬”瞬間,比如:令人無奈的翻譯錯(cuò)誤。
在追溯國際常用的《流調(diào)中心抑郁量表(CES-D)》時(shí),我們發(fā)現(xiàn),其中描述精神層面的“打不起精神”(I could not get “going”),在某個(gè)早期廣泛流傳的中文版本里,竟被直接翻譯成了 “我走路很慢” 。這個(gè)錯(cuò)誤直到十年后才在新譯本中被糾正。讓人擔(dān)憂的是,含有錯(cuò)誤翻譯的老版本在正確的新版本出現(xiàn)后仍然繼續(xù)被引用(14次),其次數(shù)甚至超過了新版本的引用數(shù),后者只有5次。
04 下一步該做什么?
作為研究者,這項(xiàng)工作的結(jié)果讓我們不安。這些不一致的抑郁問卷在提醒我們所有人。對家長和臨床工作者而言:請意識到,特定的抑郁問卷可能僅反映了抑郁的一部分內(nèi)容,不能過度依賴其結(jié)論。對于嚴(yán)肅的抑郁診斷,請務(wù)必尋求更全面的臨床評估。
對研究者和政策制定者而言:當(dāng)解讀基于不同量表得出的大規(guī)模數(shù)據(jù)時(shí),需要意識到其背后可能存在的“測量誤差”。對于研究者而言,如何建立一套具備科學(xué)性、文化與年齡適應(yīng)性的評估問卷或者問卷系統(tǒng),可能是亟待推進(jìn)的工作(Fried et al., 2022)。
準(zhǔn)確地測量是有效干預(yù)的前提;如何測量抑郁本身也反映了我們對該問題認(rèn)識的深度。心理健康問題作為一個(gè)復(fù)雜的問題,目前仍然有太多的未知之處,需要研究者的合作與不斷努力。深入理解中國兒童青少年的抑郁問題,并為中國兒童青少年找到一把更精準(zhǔn)、更合適的“尺子”,不僅是科學(xué)進(jìn)步的要求,更關(guān)乎下一代健康成長的責(zé)任。
更多研究細(xì)節(jié),見: Wang, Hu, Tian, Liu, An, Li, & Hu. The Heterogeneity of Youth Depression Scales. Chinaxiv. DOI:10.12074/202510.00115
參考文獻(xiàn):
- [1] 陳雨濛, 張亞利, 俞國良. (2022). 2010~2020 中國內(nèi)地大學(xué)生心理健康問題檢出率的元分析. 心理科學(xué)進(jìn)展, 30(5), 991–1004.
- [2] 傅小蘭, 張侃. (2023). 中國國民心理健康發(fā)展報(bào)告(2021~2022). 北京: 社會(huì)科學(xué)文獻(xiàn)出版社.
- [3] 黃瀟瀟, 張亞利, 俞國良. (2022). 2010~2020 中國內(nèi)地小學(xué)生心理健康問題檢出率的元分析. 心理科學(xué)進(jìn)展, 30(5), 953–964.
- [4] 榮麗敏, 鄭藝, 段熙明, 劉彥志, 張曉燕, 胡瑞宇, … 劉燕. (2023). 2021和2022年中國居民抑郁和焦慮癥狀及其共患的相關(guān)因素. 中國心理衛(wèi)生雜志, 37(12), 1023–1030.
- [5] 于曉琪, 張亞利, 俞國良. (2022). 2010~2020 中國內(nèi)地高中生心理健康問題檢出率的元分析. 心理科學(xué)進(jìn)展, 30(5), 978–990.
- [6] 張亞利, 靳娟娟, 俞國良. (2022). 2010~2020 中國內(nèi)地初中生心理健康問題檢出率的元分析. 心理科學(xué)進(jìn)展, 30(5), 965–977.
- [7] Derogatis, L. R., Lipman, R. S., & Covi, L. (1973). SCL-90: An outpatient psychiatric rating scale—preliminary report. Psychopharmacology Bulletin, 9(1), 13–28.
- [8] Fried, E. I., Flake, J. K., & Robinaugh, D. J. (2022). Revisiting the theoretical and methodological foundations of depression measurement. Nature Reviews Psychology, 1–11. https://doi.org/10.1038/s44159-022-00050-2
- [9] Haroz, E. E., Ritchey, M., Bass, J. K., Kohrt, B. A., Augustinavicius, J., Michalopoulos, L., … Bolton, P. (2017). How is depression experienced around the world? A systematic review of qualitative literature. Social Science & Medicine, 183, 151–162.
- [10] Lu, B., Lin, L., & Su, X. (2024). Global burden of depression or depressive symptoms in children and adolescents: A systematic review and meta-analysis. Journal of Affective Disorders, 354, 553–562.
- [11] Rice, F., Riglin, L., Lomax, T., Souter, E., Potter, R., Smith, D. J., … Thapar, A. (2019). Adolescent and adult differences in major depression symptom profiles. Journal of Affective Disorders, 243, 175–181.
- [12] Zung, W. W. K. (1965). A Self-Rating Depression Scale. Archives of General Psychiatry, 12(1), 63.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.