網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

因果潛在因子模型中的雙重穩(wěn)健推斷

2026-02-13 19:06:54　來源: CreateAMind

上海舉報

分享至

Doubly Robust Inference in Causal Latent Factor Models

因果潛在因子模型中的雙重穩(wěn)健推斷

https://arxiv.org/pdf/2402.11652

摘要

本文介紹了一種在存在未觀測混雜因素情形下估計平均處理效應(yīng)的新估計量，適用于現(xiàn)代數(shù)據(jù)豐富環(huán)境，該環(huán)境具有大量觀測單元與結(jié)果變量。所提出的估計量具有雙重穩(wěn)健性，融合了結(jié)果填補（outcome imputation）、逆概率加權(quán)（inverse probability weighting）以及一種用于矩陣補全（matrix completion）的新型交叉擬合（cross-fitting）程序。我們推導(dǎo)了有限樣本與漸近性質(zhì)的理論保證，并證明該新估計量的誤差以參數(shù)速率收斂至均值為零的高斯分布。模擬結(jié)果驗證了本文所分析估計量的形式性質(zhì)的實際相關(guān)性。

引言

本文提出了一種在存在未觀測混雜因素情形下、針對現(xiàn)代數(shù)據(jù)豐富環(huán)境的平均處理效應(yīng)估計新框架。我們將現(xiàn)代數(shù)據(jù)豐富環(huán)境定義為在大量觀測單元上收集了廣泛結(jié)果測量值的環(huán)境。我們對數(shù)據(jù)豐富環(huán)境的關(guān)注源于數(shù)字平臺（例如互聯(lián)網(wǎng)零售商、社交媒體公司和共享出行公司）、電子病歷系統(tǒng)、物聯(lián)網(wǎng)設(shè)備以及其他實時數(shù)字化數(shù)據(jù)系統(tǒng)的興起，這些系統(tǒng)以前所未有的廣度與細粒度收集經(jīng)濟與社會行為數(shù)據(jù)。

以互聯(lián)網(wǎng)零售商為例。該平臺不僅收集眾多客戶在眾多產(chǎn)品或產(chǎn)品類別上的購買信息，還記錄瀏覽次數(shù)、曝光量、轉(zhuǎn)化率、參與度指標(biāo)、導(dǎo)航路徑、配送選擇、支付方式、退貨記錄、用戶評價等數(shù)據(jù)。盡管某些變量（如地理位置、設(shè)備或瀏覽器類型）可被安全地視為相對于平臺處理行為（如廣告投放、折扣發(fā)放、網(wǎng)頁設(shè)計等）預(yù)先確定的變量，但大多數(shù)變量均為受處理干預(yù)、潛在客戶偏好及未觀測產(chǎn)品特征共同影響的結(jié)果變量。我們利用現(xiàn)代數(shù)據(jù)豐富環(huán)境中大量結(jié)果測量值的可得性，在存在未觀測混雜因素的情況下估計平均處理效應(yīng)。核心識別思想在于：若高維結(jié)果向量的每個元素均受同一低維未觀測混雜因素向量的影響，則有可能消除混雜因素的影響并識別出處理效應(yīng)。

處理效應(yīng)估計主要有兩種方法：基于結(jié)果的方法（outcome-based methods）與基于分配的方法（assignment-based methods）。仍以互聯(lián)網(wǎng)零售平臺為例，客戶與不同產(chǎn)品類別發(fā)生交互，平臺針對每個消費者-類別配對決定是否提供折扣，并記錄消費者是否在該類別中購買了產(chǎn)品。基于結(jié)果的方法通過填補每個消費者-產(chǎn)品類別配對缺失的潛在結(jié)果進行操作：該過程包括預(yù)測接受折扣的消費者若未獲得折扣是否會購買（即無折扣下的潛在結(jié)果），反之亦然，預(yù)測未獲折扣的消費者若獲得折扣是否會購買（即有折扣下的潛在結(jié)果）。相比之下，基于分配的方法則估計消費者在各產(chǎn)品類別中獲得折扣的概率，并通過對觀測結(jié)果進行與缺失概率成反比的加權(quán)來調(diào)整缺失的潛在結(jié)果。

大量文獻探討了基于結(jié)果的方法，尤其在所有混雜因素均被觀測的設(shè)定下（參見如Cochran, 1968；Rosenbaum與Rubin, 1983；Angrist, 1998；Abadie與Imbens, 2006等眾多研究）。在存在未觀測混雜因素情形下進行潛在結(jié)果填補則構(gòu)成更為復(fù)雜的挑戰(zhàn)。在此背景下，常用框架包括合成控制法及其變體（參見如Abadie與Gardeazabal, 2003；Abadie等, 2010；Cattaneo等, 2021；Arkhangelsky等, 2021）。另一種相關(guān)但不同的方法是潛在因子框架（latent factor framework）（Bai與Ng, 2002；Bai, 2009；Xiong與Pelger, 2023），其中高維結(jié)果向量的每個元素均受同一低維未觀測混雜因素向量影響。矩陣補全方法（參見如Chatterjee, 2015；Athey等, 2021；Bai與Ng, 2021；Dwivedi等, 2022a；Agarwal等, 2023a）在推薦系統(tǒng)與面板數(shù)據(jù)模型中得到廣泛應(yīng)用，與潛在因子模型密切相關(guān)。類似地，現(xiàn)有的基于分配的平均處理效應(yīng)估計程序通常依賴于無未測量混雜假設(shè)（參見如Robins等, 2000；Hirano等, 2003；Wooldridge, 2007）、共同趨勢限制（Abadie, 2005）或工具變量的可得性（Abadie, 2003；Sloczynski等, 2024）。

本文提出了一種在存在未觀測混雜因素情形下的平均處理效應(yīng)雙重穩(wěn)健估計量（參見Robins等, 1994；Bang與Robins, 2005；Chernozhukov等, 2018）。該估計量在潛在因子框架下同時利用結(jié)果過程與處理分配機制的信息，將結(jié)果填補與逆概率加權(quán)相結(jié)合，并引入一種用于矩陣補全的新型交叉擬合方法。我們證明，相較于其他基于結(jié)果或基于分配的估計量，所提出的雙重穩(wěn)健估計量具有更優(yōu)的有限樣本保證。此外，在矩陣補全誤差率可被證明有效的條件下，無論所用矩陣補全算法的其他性質(zhì)如何，該雙重穩(wěn)健估計量均漸近無偏、近似服從高斯分布，并以參數(shù)速率收斂。

據(jù)我們所知，本文是首篇同時利用分配過程與結(jié)果過程中的潛在結(jié)構(gòu)，以獲得存在未觀測混雜因素時平均處理效應(yīng)雙重穩(wěn)健估計量的研究。Arkhangelsky與Imbens（2022）在縱向數(shù)據(jù)下研究了雙重穩(wěn)健識別，其假設(shè)是對處理分配隨時間變化的某一函數(shù)（例如個體暴露于處理的次數(shù)比例）進行條件化足以消除混雜。Athey等（2021）、Bai與Ng（2021）、Dwivedi等（2022a）、Agarwal等（2023a）以及Xiong與Pelger（2023）提出了應(yīng)用矩陣補全技術(shù)填補潛在結(jié)果的估計量。盡管這些研究利用了結(jié)果過程中的低秩限制，但并未探究處理分配過程中可能存在類似潛在結(jié)構(gòu)的可能性。本文對此問題進行了探討，并證明納入分配機制結(jié)構(gòu)知識可帶來實質(zhì)性收益。

設(shè)定

估計

在本節(jié)中，我們提出一種利用處理分配矩陣A和觀測結(jié)果矩陣Y來估計的程序，其中

本節(jié)所提出的估計量將矩陣補全作為關(guān)鍵子程序加以利用。我們以矩陣補全方法的簡要概述開啟本節(jié)。

3.2. 關(guān)鍵構(gòu)建模塊

3.3. 雙重穩(wěn)健（DR）估計量

4. 主要結(jié)果

4.1. 假設(shè)
關(guān)于數(shù)據(jù)生成過程的要求。我們對數(shù)據(jù)的生成方式作出兩項假設(shè)。首先，我們對分配概率施加一個正值性條件。

公式(14)要求，在每個單元的兩個分區(qū)內(nèi)，對于每次測量，估計的潛在結(jié)果均值和估計的分配概率與分配概率中的誤差聯(lián)合獨立。類似地，公式(15)要求，在每個單元的兩個分區(qū)內(nèi)，對于每次測量，估計的分配概率與分配概率和潛在結(jié)果中的噪聲聯(lián)合獨立。像公式(14)和公式(15)這樣的條件在雙穩(wěn)健估計文獻中是常見的。Chernozhukov等人(2018)采用交叉擬合裝置，在沒有未測量混雜因素的背景下，強制執(zhí)行類似于假設(shè)4的條件。第5節(jié)為矩陣估計提供了一種新穎的交叉擬合流程，在該流程下，假設(shè)4對任何MC算法都成立（在對噪聲變量的額外假設(shè)下）。

4.3.漸近保證

該模型中滯后處理效應(yīng)的存在使得為整個處理序列定義因果估計量變得至關(guān)重要。附錄I描述了如何將所提出的雙穩(wěn)健估計擴展到處理序列，并推導(dǎo)了定理1的推廣形式。

5. 帶有交叉擬合的矩陣補全

5.1. 交叉擬合-MC：一種用于矩陣補全的元交叉擬合算法

許多MC算法旨在對隨機缺失模式下的矩陣進行去噪和缺失值插補；研究最常見的缺失模式是每個條目有相同的缺失概率，且獨立于其他所有因素。相比之下，交叉擬合-MC生成的模式中，一個區(qū)塊內(nèi)的所有條目都是確定性缺失的，如圖3(b)所示。最近關(guān)于矩陣補全方法與因果推斷模型之間相互作用的研究——特別是在合成控制框架內(nèi)——已經(jīng)貢獻了允許塊狀缺失的矩陣補全算法（參見，例如，Athey等人，2021；Agarwal等人，2021；Bai和Ng，2021；Agarwal等人，2023b；Arkhangelsky等人，2021；Agarwal等人，2023a；Dwivedi等人，2022a,b）。然而，將這些方法已知的理論保證應(yīng)用于本文的設(shè)定存在挑戰(zhàn)，原因在于：(i) 使用了交叉擬合——這創(chuàng)建了所有觀測都缺失的區(qū)塊——以及 (ii) 在完全缺失的區(qū)塊之外，仍然可能存在具有異質(zhì)缺失概率的缺失觀測。在下一節(jié)中，我們將展示如何修改為塊狀缺失模式設(shè)計的MC算法，使其能夠應(yīng)用于我們的帶有交叉擬合和折疊外異質(zhì)缺失概率的設(shè)定。為具體起見，我們采用Bai和Ng（2021）的Tall-Wide矩陣補全算法進行說明。

5.2. 交叉擬合-SVD算法

交叉擬合-SVD是一個端到端的MC算法，通過將交叉擬合-MC元算法與Bai和Ng（2021）的Tall-Wide算法（我們稱之為TW）實例化而獲得。為完整起見，我們在第5.2.1節(jié)詳細描述TW算法，然后在第5.2.2節(jié)中使用它來描述交叉擬合-SVD。

原文鏈接：https://arxiv.org/pdf/2402.11652

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.