觀察性研究是探索疾病因果關(guān)聯(lián)的重要手段,但其結(jié)論的可靠性高度依賴于能否有效控制混雜因素(Confounders)。2025年7月發(fā)表在JAMA Network Open上的一項題為“Confounder Selection in Observational Studies in High-Impact Medical and Epidemiological Journals”研究,系統(tǒng)回顧了近20年來頂級醫(yī)學(xué)和流行病學(xué)期刊中觀察性研究的混雜因素選擇方法。研究結(jié)果令人驚訝:近一半的研究在選擇調(diào)整哪些混雜因素時,竟然沒有給出任何理由!
![]()
為什么混雜因素的選擇如此重要?
![]()
在觀察性研究中,混雜因素(如年齡、吸煙史等)可能同時與暴露因素和結(jié)局相關(guān)聯(lián),若不妥善處理,會扭曲對暴露-結(jié)局真實效應(yīng)的估計。想象一下,你想研究“喝咖啡”(暴露)是否會導(dǎo)致“心臟病”(結(jié)局)。但“年齡”可能同時影響喝咖啡的習(xí)慣和心臟病風(fēng)險——年齡就是一個混雜因素。如果不調(diào)整年齡,你可能會錯誤地將年齡的影響歸因于咖啡。因此,準(zhǔn)確識別并調(diào)整混雜因素是觀察性研究得出可靠因果推論的關(guān)鍵前提。
![]()
觀察性研究中的混雜控制進步了嗎?——20年頂刊證據(jù)評估與學(xué)科差異
![]()
該研究系統(tǒng)評估了2003、2013、2023年發(fā)表在頂級綜合性醫(yī)學(xué)期刊(NEJM、Lancet、JAMA、BMJ、Annals of Internal Medicine)和5本專業(yè)流行病學(xué)期刊(European J Epi, Int J Epi, Annals of Epi, American J Epi, Epidemiology)上的觀察性研究的混雜因素選擇方法。
![]()
通過篩選,最終納入 623項需控制混雜的觀察性研究(197篇醫(yī)學(xué),426篇流行病學(xué))。研究團隊隨機抽取50%文獻(n=312)進行全文審閱,將混雜因素選擇方法分為7類:未調(diào)整、調(diào)整但未指明變量、無理由選擇、基于結(jié)局關(guān)聯(lián)、依賴統(tǒng)計標(biāo)準(zhǔn)、采用因果模型(DAG或理論框架)。
![]()
即使頂尖期刊,混雜因素篩選方法和報告改進速度仍然緩慢
![]()
![]()
選擇依據(jù)的透明度有待提升:在所有評估的研究中,有相當(dāng)比例(45.1%,281篇)雖然報告了調(diào)整的混雜變量列表,但未闡述選擇這些變量的具體理由或依據(jù)。
統(tǒng)計驅(qū)動方法仍有應(yīng)用:近五分之一的研究(19.4%, 121篇)主要依賴統(tǒng)計標(biāo)準(zhǔn)(如逐步回歸、效應(yīng)量變化策略)來選擇調(diào)整變量,這類方法在方法學(xué)界對其潛在偏倚風(fēng)險已有較多討論。
基于因果模型的方法應(yīng)用正在增長但基數(shù)仍低:明確報告使用基于因果理論模型(DAG或文本闡述)來選擇混雜因素的研究占6.7% (42篇)。其中35篇使用了DAG圖進行可視化,7篇在文本中進行了系統(tǒng)闡述。值得欣慰的是,這種方法的應(yīng)用呈現(xiàn)顯著增長趨勢。盡管如此,即使在2023年的流行病學(xué)期刊中,這一學(xué)界廣泛推薦方法應(yīng)用率僅為23.5%,占比仍不足四分之一。
“未說明理由”的比例雖有下降但仍居高位:未提供選擇理由的研究比例,從2003年的48.7% (111/228) 下降到2023年的41.5% (68/164),顯示有一定進步,但“未說明理由”仍是最高頻的報告方式。
![]()
學(xué)科與設(shè)計差異:流行病學(xué)期刊在更系統(tǒng)地報告選擇依據(jù)(基于結(jié)局關(guān)聯(lián)或因果模型)方面表現(xiàn)略好。醫(yī)學(xué)期刊在2023年因果模型的使用率(20.0%)顯著提升,但未說明理由的比例(48.9%)仍高于流行病學(xué)期刊(38.7%)。隊列研究更傾向于使用因果模型(8.8%),而病例對照(2.1%)和橫斷面研究(2.1%)應(yīng)用較少。
![]()
學(xué)界一致倡導(dǎo)采用基于因果理論模型篩選混雜因素,為何進展相對緩慢?
![]()
盡管方法學(xué)指南(如STROBE)和專家共識一直倡導(dǎo)基于因果理論模型篩選混雜因素,并指出了傳統(tǒng)數(shù)據(jù)驅(qū)動方法的潛在局限,但即使在頂級期刊發(fā)表的觀察性研究中,混雜因素的篩選和報告仍有較大提升空間,未能充分說明混雜因素選擇依據(jù)的情況依然常見。
導(dǎo)致這一現(xiàn)象的原因可能涉及多方面因素,例如研究者對現(xiàn)代因果推斷方法(如DAG)的熟悉程度、研究實施中的時間與資源限制、期刊審稿過程中對方法學(xué)細節(jié)要求的側(cè)重程度,以及改變固有習(xí)慣的難度。
![]()
如何提升觀察性研究混雜因素篩選的嚴(yán)謹(jǐn)性?
![]()
這項研究的結(jié)果提示,提升觀察性研究的嚴(yán)謹(jǐn)性需要研究共同體各方協(xié)同努力:
研究者:應(yīng)重視因果框架構(gòu)建,在研究設(shè)計階段使用DAG或理論框架明確定義變量關(guān)系,并在論文中詳細說明混雜因素的選擇依據(jù),避免依賴逐步回歸等傳統(tǒng)統(tǒng)計方法。
期刊與審稿人:需細化投稿要求,強化STROBE指南的執(zhí)行,并在審稿中重點評估混雜因素選擇的邏輯。同時,應(yīng)推廣方法學(xué)嚴(yán)謹(jǐn)?shù)膬?yōu)秀研究,樹立標(biāo)桿。
資助與學(xué)術(shù)機構(gòu):應(yīng)加強方法學(xué)培訓(xùn),將因果推斷(如DAG)納入課程體系,并在項目評審中優(yōu)先支持研究設(shè)計嚴(yán)謹(jǐn)?shù)恼n題,推動混雜因素篩選和報告的改進。
![]()
總結(jié)與展望
![]()
觀察性研究是醫(yī)學(xué)證據(jù)的重要來源,但混雜因素的選擇與報告仍是方法學(xué)關(guān)鍵挑戰(zhàn)。最新評估顯示,雖然DAG等方法應(yīng)用增加,多數(shù)研究仍缺乏選擇依據(jù)的充分說明。提升這一環(huán)節(jié)的透明度和科學(xué)性對研究可信度至關(guān)重要,需要研究者、期刊和資助機構(gòu)協(xié)同努力。只有構(gòu)建嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)生態(tài),才能獲得更加可靠的醫(yī)學(xué)證據(jù)。
參考文獻:Correia LCL, et al. Confounder Selection in Observational Studies in High-Impact Medical and Epidemiological Journals. JAMA Netw Open. 2025;8(7):e2524176. doi:10.1001/jamanetworkopen.2025.24176
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.