Doubly Robust Inference in Causal Latent Factor Models
因果潛在因子模型中的雙重穩(wěn)健推斷
https://arxiv.org/pdf/2402.11652
![]()
![]()
摘要
本文介紹了一種在存在未觀測混雜因素情形下估計平均處理效應(yīng)的新估計量,適用于現(xiàn)代數(shù)據(jù)豐富環(huán)境,該環(huán)境具有大量觀測單元與結(jié)果變量。所提出的估計量具有雙重穩(wěn)健性,融合了結(jié)果填補(outcome imputation)、逆概率加權(quán)(inverse probability weighting)以及一種用于矩陣補全(matrix completion)的新型交叉擬合(cross-fitting)程序。我們推導(dǎo)了有限樣本與漸近性質(zhì)的理論保證,并證明該新估計量的誤差以參數(shù)速率收斂至均值為零的高斯分布。模擬結(jié)果驗證了本文所分析估計量的形式性質(zhì)的實際相關(guān)性。
- 引言
本文提出了一種在存在未觀測混雜因素情形下、針對現(xiàn)代數(shù)據(jù)豐富環(huán)境的平均處理效應(yīng)估計新框架。我們將現(xiàn)代數(shù)據(jù)豐富環(huán)境定義為在大量觀測單元上收集了廣泛結(jié)果測量值的環(huán)境。我們對數(shù)據(jù)豐富環(huán)境的關(guān)注源于數(shù)字平臺(例如互聯(lián)網(wǎng)零售商、社交媒體公司和共享出行公司)、電子病歷系統(tǒng)、物聯(lián)網(wǎng)設(shè)備以及其他實時數(shù)字化數(shù)據(jù)系統(tǒng)的興起,這些系統(tǒng)以前所未有的廣度與細粒度收集經(jīng)濟與社會行為數(shù)據(jù)。
以互聯(lián)網(wǎng)零售商為例。該平臺不僅收集眾多客戶在眾多產(chǎn)品或產(chǎn)品類別上的購買信息,還記錄瀏覽次數(shù)、曝光量、轉(zhuǎn)化率、參與度指標(biāo)、導(dǎo)航路徑、配送選擇、支付方式、退貨記錄、用戶評價等數(shù)據(jù)。盡管某些變量(如地理位置、設(shè)備或瀏覽器類型)可被安全地視為相對于平臺處理行為(如廣告投放、折扣發(fā)放、網(wǎng)頁設(shè)計等)預(yù)先確定的變量,但大多數(shù)變量均為受處理干預(yù)、潛在客戶偏好及未觀測產(chǎn)品特征共同影響的結(jié)果變量。我們利用現(xiàn)代數(shù)據(jù)豐富環(huán)境中大量結(jié)果測量值的可得性,在存在未觀測混雜因素的情況下估計平均處理效應(yīng)。核心識別思想在于:若高維結(jié)果向量的每個元素均受同一低維未觀測混雜因素向量的影響,則有可能消除混雜因素的影響并識別出處理效應(yīng)。
處理效應(yīng)估計主要有兩種方法:基于結(jié)果的方法(outcome-based methods)與基于分配的方法(assignment-based methods)。仍以互聯(lián)網(wǎng)零售平臺為例,客戶與不同產(chǎn)品類別發(fā)生交互,平臺針對每個消費者-類別配對決定是否提供折扣,并記錄消費者是否在該類別中購買了產(chǎn)品。基于結(jié)果的方法通過填補每個消費者-產(chǎn)品類別配對缺失的潛在結(jié)果進行操作:該過程包括預(yù)測接受折扣的消費者若未獲得折扣是否會購買(即無折扣下的潛在結(jié)果),反之亦然,預(yù)測未獲折扣的消費者若獲得折扣是否會購買(即有折扣下的潛在結(jié)果)。相比之下,基于分配的方法則估計消費者在各產(chǎn)品類別中獲得折扣的概率,并通過對觀測結(jié)果進行與缺失概率成反比的加權(quán)來調(diào)整缺失的潛在結(jié)果。
大量文獻探討了基于結(jié)果的方法,尤其在所有混雜因素均被觀測的設(shè)定下(參見如Cochran, 1968;Rosenbaum與Rubin, 1983;Angrist, 1998;Abadie與Imbens, 2006等眾多研究)。在存在未觀測混雜因素情形下進行潛在結(jié)果填補則構(gòu)成更為復(fù)雜的挑戰(zhàn)。在此背景下,常用框架包括合成控制法及其變體(參見如Abadie與Gardeazabal, 2003;Abadie等, 2010;Cattaneo等, 2021;Arkhangelsky等, 2021)。另一種相關(guān)但不同的方法是潛在因子框架(latent factor framework)(Bai與Ng, 2002;Bai, 2009;Xiong與Pelger, 2023),其中高維結(jié)果向量的每個元素均受同一低維未觀測混雜因素向量影響。矩陣補全方法(參見如Chatterjee, 2015;Athey等, 2021;Bai與Ng, 2021;Dwivedi等, 2022a;Agarwal等, 2023a)在推薦系統(tǒng)與面板數(shù)據(jù)模型中得到廣泛應(yīng)用,與潛在因子模型密切相關(guān)。類似地,現(xiàn)有的基于分配的平均處理效應(yīng)估計程序通常依賴于無未測量混雜假設(shè)(參見如Robins等, 2000;Hirano等, 2003;Wooldridge, 2007)、共同趨勢限制(Abadie, 2005)或工具變量的可得性(Abadie, 2003;Sloczynski等, 2024)。
本文提出了一種在存在未觀測混雜因素情形下的平均處理效應(yīng)雙重穩(wěn)健估計量(參見Robins等, 1994;Bang與Robins, 2005;Chernozhukov等, 2018)。該估計量在潛在因子框架下同時利用結(jié)果過程與處理分配機制的信息,將結(jié)果填補與逆概率加權(quán)相結(jié)合,并引入一種用于矩陣補全的新型交叉擬合方法。我們證明,相較于其他基于結(jié)果或基于分配的估計量,所提出的雙重穩(wěn)健估計量具有更優(yōu)的有限樣本保證。此外,在矩陣補全誤差率可被證明有效的條件下,無論所用矩陣補全算法的其他性質(zhì)如何,該雙重穩(wěn)健估計量均漸近無偏、近似服從高斯分布,并以參數(shù)速率收斂。
據(jù)我們所知,本文是首篇同時利用分配過程與結(jié)果過程中的潛在結(jié)構(gòu),以獲得存在未觀測混雜因素時平均處理效應(yīng)雙重穩(wěn)健估計量的研究。Arkhangelsky與Imbens(2022)在縱向數(shù)據(jù)下研究了雙重穩(wěn)健識別,其假設(shè)是對處理分配隨時間變化的某一函數(shù)(例如個體暴露于處理的次數(shù)比例)進行條件化足以消除混雜。Athey等(2021)、Bai與Ng(2021)、Dwivedi等(2022a)、Agarwal等(2023a)以及Xiong與Pelger(2023)提出了應(yīng)用矩陣補全技術(shù)填補潛在結(jié)果的估計量。盡管這些研究利用了結(jié)果過程中的低秩限制,但并未探究處理分配過程中可能存在類似潛在結(jié)構(gòu)的可能性。本文對此問題進行了探討,并證明納入分配機制結(jié)構(gòu)知識可帶來實質(zhì)性收益。
![]()
![]()
- 設(shè)定
![]()
![]()
![]()
![]()
![]()
- 估計
在本節(jié)中,我們提出一種利用處理分配矩陣A和觀測結(jié)果矩陣Y來估計的程序,其中
![]()
本節(jié)所提出的估計量將矩陣補全作為關(guān)鍵子程序加以利用。我們以矩陣補全方法的簡要概述開啟本節(jié)。
![]()
![]()
3.2. 關(guān)鍵構(gòu)建模塊
![]()
![]()
![]()
![]()
![]()
3.3. 雙重穩(wěn)健(DR)估計量
![]()
4. 主要結(jié)果
![]()
![]()
4.1. 假設(shè)
關(guān)于數(shù)據(jù)生成過程的要求。我們對數(shù)據(jù)的生成方式作出兩項假設(shè)。首先,我們對分配概率施加一個正值性條件。
![]()
![]()
![]()
![]()
![]()
公式(14)要求,在每個單元的兩個分區(qū)內(nèi),對于每次測量,估計的潛在結(jié)果均值和估計的分配概率與分配概率中的誤差聯(lián)合獨立。類似地,公式(15)要求,在每個單元的兩個分區(qū)內(nèi),對于每次測量,估計的分配概率與分配概率和潛在結(jié)果中的噪聲聯(lián)合獨立。像公式(14)和公式(15)這樣的條件在雙穩(wěn)健估計文獻中是常見的。Chernozhukov等人(2018)采用交叉擬合裝置,在沒有未測量混雜因素的背景下,強制執(zhí)行類似于假設(shè)4的條件。第5節(jié)為矩陣估計提供了一種新穎的交叉擬合流程,在該流程下,假設(shè)4對任何MC算法都成立(在對噪聲變量的額外假設(shè)下)。
![]()
![]()
![]()
![]()
![]()
4.3.漸近保證
![]()
![]()
![]()
![]()
該模型中滯后處理效應(yīng)的存在使得為整個處理序列定義因果估計量變得至關(guān)重要。附錄I描述了如何將所提出的雙穩(wěn)健估計擴展到處理序列,并推導(dǎo)了定理1的推廣形式。
5. 帶有交叉擬合的矩陣補全
![]()
5.1. 交叉擬合-MC:一種用于矩陣補全的元交叉擬合算法
![]()
![]()
![]()
![]()
![]()
![]()
許多MC算法旨在對隨機缺失模式下的矩陣進行去噪和缺失值插補;研究最常見的缺失模式是每個條目有相同的缺失概率,且獨立于其他所有因素。相比之下,交叉擬合-MC生成的模式中,一個區(qū)塊內(nèi)的所有條目都是確定性缺失的,如圖3(b)所示。最近關(guān)于矩陣補全方法與因果推斷模型之間相互作用的研究——特別是在合成控制框架內(nèi)——已經(jīng)貢獻了允許塊狀缺失的矩陣補全算法(參見,例如,Athey等人,2021;Agarwal等人,2021;Bai和Ng,2021;Agarwal等人,2023b;Arkhangelsky等人,2021;Agarwal等人,2023a;Dwivedi等人,2022a,b)。然而,將這些方法已知的理論保證應(yīng)用于本文的設(shè)定存在挑戰(zhàn),原因在于:(i) 使用了交叉擬合——這創(chuàng)建了所有觀測都缺失的區(qū)塊——以及 (ii) 在完全缺失的區(qū)塊之外,仍然可能存在具有異質(zhì)缺失概率的缺失觀測。在下一節(jié)中,我們將展示如何修改為塊狀缺失模式設(shè)計的MC算法,使其能夠應(yīng)用于我們的帶有交叉擬合和折疊外異質(zhì)缺失概率的設(shè)定。為具體起見,我們采用Bai和Ng(2021)的Tall-Wide矩陣補全算法進行說明。
![]()
5.2. 交叉擬合-SVD算法
交叉擬合-SVD是一個端到端的MC算法,通過將交叉擬合-MC元算法與Bai和Ng(2021)的Tall-Wide算法(我們稱之為TW)實例化而獲得。為完整起見,我們在第5.2.1節(jié)詳細描述TW算法,然后在第5.2.2節(jié)中使用它來描述交叉擬合-SVD。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
原文鏈接:https://arxiv.org/pdf/2402.11652
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.