<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      通過校準自舉實現有限樣本有效推斷

      0
      分享至

      Finite Sample Valid Inference via Calibrated Bootstrap

      通過校準自舉實現有限樣本有效推斷

      https://arxiv.org/pdf/2408.16763


      摘要
      盡管自助法(bootstrap method)被廣泛用作不確定性量化的一般方法,但在實際應用中卻面臨諸多困難,引發了對其有效性的擔憂。本文提出了一種新的基于重采樣的方法,稱為校準自助法(calibrated bootstrap),旨在從大小為 n n 的樣本中生成有限樣本有效(finite sample-valid)的參數推斷。其核心思想是對一種 m m-out-of- n n重采樣方案進行校準,其中校準參數 m m 根據參數估計中損失函數累積分布函數所導出的推斷樞軸量(inferential pivotal quantities)來確定。


      本文通過帶或不帶 L1 懲罰的線性回歸模型,在高維設定和真實數據應用場景下對所提方法進行了說明,并與現有方法進行了比較。最后,文章就若干值得進一步研究的開放性問題提出了評論。

      關鍵詞:貝葉斯自助法;L1 懲罰;樞軸量;輪廓似然;隨機逼近。

      1 引言
      自助法旨在通過對觀測數據進行重采樣,來估計所關注統計量的抽樣分布。自 Efron(1979)的開創性論文(另見 Efron, 2003)以來,由于其簡潔性和高效性(參見如 Efron 和 Tibshirani, 1993),自助法已成為統計推斷與預測領域不可或缺的工具。它也激發了其他相關領域的研究,包括其貝葉斯對應方法(參見 Rubin, 1981;Efron, 1982;Newton 和 Raftery, 1994;Efron, 2012;Newton 等, 2021 及其中參考文獻)。

      然而,在缺乏理論保證的情形下,實踐者可能會誤用自助法(Shao 和 Tu, 2012)。在具體應用中必須謹慎(Martin, 2015)。首先,自助法的理論基礎主要圍繞其漸近有效性展開。具體而言,研究者主要致力于證明:當樣本量趨于無窮時,自助法能一致地估計目標統計量的抽樣分布(參見如 Bickel 和 Freedman, 1981;Singh, 1981;Wellner 和 Zhan, 1996;van der Vaart 和 Wellner, 1996;Kosorok, 2008;Efron 和 Tibshirani, 1993 及其中參考文獻)。其次,已有研究表明,即使在基于大樣本理論設計的應用場景中,自助法仍可能失效(參見如 Bickel 和 Freedman, 1983;Abrevaya 和 Huang, 2005;Chernozhukov 等, 2023 及其中參考文獻)。例如,在高維線性回歸設定中(當 n → ∞ 而 p / n → c > 0 ,其中 p p 為預測變量個數),自助法被證明無法一致估計回歸系數的真實抽樣分布;數值實驗也表明,現有自助法對回歸系數向量 β β 的推斷效果極差(El Karoui 和 Purdom, 2018)。

      為克服標準自助法(即采用 n n-out-of- n n 有放回重采樣)在某些情形下的局限性,研究者探索了替代性的重采樣方法。這些替代方法同樣需具備漸近有效性的理論支撐,包括有放回和無放回的 m m-out-of- n n 重采樣——后者亦稱子集抽樣(subset sampling)(Politis 和 Romano, 1994;Bickel 和 Sakov, 2008;Bickel 等, 2012),其思想可追溯至 Bretagnolle(1983)。然而,據我們所知,目前關于基于重采樣的有限樣本有效推斷方法的理論支持仍存在顯著空白。

      為獲得理想的有限樣本性能,重采樣方案可能需要根據具體模型和觀測數據進行自適應調整。本文旨在探索適用于有限樣本情形、具有自適應性且計算可行的重采樣方法,以實現對模型參數的有效頻率學派推斷(valid frequentist inference)。也就是說,對于給定模型,該推斷方法應能控制第一類錯誤率。例如,所構造的參數 95% 置信區間應在至少(并接近)95% 的情況下覆蓋真實參數值。為此,我們沿著近期統計推斷基礎理論的發展脈絡(Fisher, 1973;Shafer, 1976;Dempster, 2008;Singh 等, 2007;Xie 和 Singh, 2013;Hannig, 2009;Hannig 等, 2016;Martin 和 Liu, 2013, 2015;Martin, 2015;Cella 和 Martin, 2022),開發具有堅實理論依據的計算方法,并盡可能沿用人們熟悉的樞軸量方法(pivotal method)的基本思想。

      理論上合理的有限樣本有效推斷方法在現有文獻中已有深入研究。然而,能夠實際應用于求解此類問題的計算工具通常缺失,尤其在高維場景下往往不可行(Martin, 2015)。本文的主要目標是提出一種計算高效、基于重采樣的數值策略,以逼近理想的理論解。從哲學角度看,通過重采樣進行推斷至少是微妙的,因為重采樣帶來的變異性推斷中的不確定性評估是兩個不同的概念。本文的關鍵思想在于:將重采樣所產生的變異性與推斷所需的不確定性相匹配

      2 有效推斷的基礎:概述

      2.1 參數推斷的廣義關聯方法






      為了在構建置信區域的背景下表述清晰,我們正式定義了面向置信度的推斷過程的有效性(validity),該定義與自助法文獻中用于考慮大樣本基礎上有效性的定義一致。



      2.2 T-置信分布





      3 校準自助法

      在本節中,我們提出一種計算上可行的方法,通過自適應重采樣程序實現有效的參數推斷。該方法稱為校準自助法(Calibrated Bootstrap, CB),包含兩個步驟:重采樣近似(Resampling Approximation, RA)和分布重采樣(Distributional Resampling, DR)。RA 步驟針對一組預設的置信系數,搜索能夠最佳逼近參數 θ ∈ Θ精確置信區域的重采樣方案。DR 步驟則從 RA 步驟獲得的自助估計樣本中選取部分樣本,用于構建感興趣未知參數的置信分布。這兩個步驟被總結為兩個算法,并在第 3.1 節和第 3.4 節中詳細討論。

      3.1 重采樣近似










      3.2 簡單示例下的 RA 方法




      3.3 線性回歸示例下的 RA 方法

      為說明所提出的方法,此處我們展示一項在高維設定下關于線性回歸的研究。算法 1 的其他應用將在第 4 節中進一步說明。

      例 2(高維線性回歸). 考慮線性回歸模型:













      3.5 邊際參數推斷





      4 L1懲罰線性回歸的應用

      回顧例 2 中所述的線性回歸模型(16)。此處考慮 β β 的 L1 懲罰估計量,即廣為人知且被廣泛使用的 Lasso 估計量(Tibshirani, 1996),可表示為


      其中 λ > 0
      為調優參數。Lasso 估計量在 p > n 的情形下尤其有用,因為它可以通過將部分系數收縮至零來實現變量選擇。由于引入了正則化項,相較于普通最小二乘(OLS)估計量,Lasso 估計量通常更穩健,預測能力更強。

      盡管 Lasso 在真實數據分析場景中被廣泛應用(例如全基因組關聯研究 GWAS,Uffelmann 等, 2021;Zeng 等, 2015),但由于加入了懲罰項,設計一種有效且高效的推斷程序通常被認為較為困難。基于重采樣的方法,如自助法和置換檢驗(Arbet 等, 2017),是模型推斷中最常用的方法。然而,先前的理論研究表明,即使在漸近情形下,Lasso 的自助法推斷程序的有效性也難以確立(Fu 和 Knight, 2000;Chatterjee 和 Lahiri, 2010, 2011)。

      所提出的 CB 方法的一個顯著優勢在于,它能夠為像 Lasso 這類數學上難以推導有效推斷的統計方法提供有效的頻率學派推斷程序。我們首先將在第 4.1 節通過模擬研究展示所提方法的效率,然后在第 4.2 節通過一個真實數據示例將我們的方法與其他方法進行比較。

      4.1 模擬研究





      4.2 真實數據示例


      Lasso 得到一個包含七個變量的模型:性別、BMI、MAP、S1、S3、S5 和 S6。對于這些選定的變量,我們將我們提出的 CB 方法所獲得的置信區間與標準自助法所得結果進行比較。我們還納入了 Lee 等人(2016)提出的一種近期方法——我們稱之為“精確 POSI”——該方法專為 Lasso 的后選擇推斷設計,能夠在給定所選模型的條件下,為 Lasso 所選預測變量構造有效的置信區間。三種方法構建的 95% 置信區間如圖 5 所示。對于這三種方法,我們的方法確保在包含全部 10 個預測變量的完整模型下,覆蓋率至少達到 95%,而精確 POSI 僅保證在包含七個選定預測變量的模型下條件覆蓋率達到這一水平。


      標準自助法不能保證 95% 的覆蓋率。我們的 CB 方法所得置信區間長度與其他方法相當,但相較于精確 POSI 在 S6 上的區間明顯更短。結果還表明,所有方法在 S6 不顯著這一點上達成了一致。

      5 結論性評述

      本文提出了一種重采樣近似方法,該方法能夠基于似然函數實現有效的有限樣本聯合推斷,并基于輪廓似然實現邊際推斷。該方法可輕松推廣至使用一般損失函數進行點估計的情形。通過校準重采樣與精煉步驟,所提方法避免了傳統自助法的局限性,并被證明能夠獲得有效的推斷結果。據我們所知,這是首次將重采樣方法用于適應有限樣本情形下的有效推斷。

      盡管所提出的方法相較于傳統自助法涉及更高的計算成本,但其在計算上仍是可行的。此外,該方法可方便地在現代計算機集群上并行化執行,從而進一步提升其計算可行性與效率。

      我們在發展基于重采樣的有限樣本有效推斷方法時的核心思想是:尋找一種重采樣方案,使得針對預設置信水平所得置信區域具有有效性保證。在所提出的 CB 方法中,我們構建了一種隨機逼近算法,以尋找自適應的 m m-out-of- n n 重采樣方案。未來的研究與應用中,可以考慮其他重采樣方案以及生成自助估計樣本的替代方式。例如,可考慮從自適應的 Dirichlet( δ 1 δ1) 分布中抽取權重,構造加權最大似然估計量,其中 δ δ 代表校準參數。該方法預計在觀測樣本量較小時尤為有用。

      然而值得注意的是,對單個參數獲得精確的邊際推斷可能是一項復雜任務,尚需進一步研究。這凸顯了在復雜模型中開展有限樣本有效推斷所面臨的普遍挑戰。本文采用 Martin(2015, 2023b)提出的思想來“邊緣化”干擾參數,所提出的方法已被證明在理論上有效且經驗上高效。這一思路指明了一個富有潛力的方向,鼓勵人們就邊際推斷這一難題——對所有現有學派而言均具挑戰性——展開更具創造性的思考。

      本文的主要焦點在于開發促進高效參數推斷的計算方法。Cella 和 Martin(2022)則在非參數背景下,為風險最小化器的近似推斷構建了一個推斷模型(IM)框架。鑒于許多現代機器學習應用需要基于未知模型或損失函數進行推斷,一個引人興趣的未來方向是:探索本文所得洞見是否能有效適配于 Cella 和 Martin(2022)所提出的框架,以實現高效的推斷。

      原文鏈接:https://arxiv.org/pdf/2408.16763

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      1600萬次可以蒸餾 AI 模型嗎?ChatGPT回答:不足以創造我這種級別的

      1600萬次可以蒸餾 AI 模型嗎?ChatGPT回答:不足以創造我這種級別的

      三言四拍
      2026-02-24 21:18:57
      央視主持沙桐:離婚后妻子嘲諷二人多年沒性生活,前妻直言別扯淡

      央視主持沙桐:離婚后妻子嘲諷二人多年沒性生活,前妻直言別扯淡

      冷紫葉
      2026-02-25 15:28:41
      120抵達40分鐘后病人才上救護車,老人搶救無效死亡急救中心被判賠17萬余元 急救搬抬如何破局?|紅星深度

      120抵達40分鐘后病人才上救護車,老人搶救無效死亡急救中心被判賠17萬余元 急救搬抬如何破局?|紅星深度

      紅星新聞
      2026-02-25 21:05:18
      伊朗這次沒嘴炮,直接給中國打款:導彈我買了,美國你看著辦

      伊朗這次沒嘴炮,直接給中國打款:導彈我買了,美國你看著辦

      十夏九漓
      2026-02-25 22:36:07
      前瞻|在德國自身重新定位時,總理默茨首次訪華謀劃雙邊關系與對華定位

      前瞻|在德國自身重新定位時,總理默茨首次訪華謀劃雙邊關系與對華定位

      澎湃新聞
      2026-02-25 07:06:27
      港媒:“下一波‘中國沖擊’很重要,因為它不僅僅是個經濟故事”

      港媒:“下一波‘中國沖擊’很重要,因為它不僅僅是個經濟故事”

      參考消息
      2026-02-25 09:09:04
      韓“蛇蝎美人”旅館誘殺男子致2死1傷,被捕后漲粉50倍,曾用AI精密策劃殺人步驟

      韓“蛇蝎美人”旅館誘殺男子致2死1傷,被捕后漲粉50倍,曾用AI精密策劃殺人步驟

      紅星新聞
      2026-02-25 13:23:34
      當年舉報畢福劍的那位告密者竟然變成這樣了!誰能想到啊?

      當年舉報畢福劍的那位告密者竟然變成這樣了!誰能想到啊?

      霹靂炮
      2026-02-06 13:48:54
      硬扛了3天后,美國終于認命,這場全球大戰,結局真被中國說準了

      硬扛了3天后,美國終于認命,這場全球大戰,結局真被中國說準了

      次元君情感
      2026-02-26 02:25:34
      65歲男子和10歲繼女:大量不雅照流出,細節披露,一畫面難以啟齒

      65歲男子和10歲繼女:大量不雅照流出,細節披露,一畫面難以啟齒

      博士觀察
      2026-02-25 22:27:52
      黃曉明戀情曝光!與美女穿情侶裝并同游,女方年齡被扒疑似小22歲

      黃曉明戀情曝光!與美女穿情侶裝并同游,女方年齡被扒疑似小22歲

      萌神木木
      2026-02-25 16:55:16
      WTT新加坡大滿貫八強對陣:孫穎莎內戰,王曼昱對韓朱雨玲

      WTT新加坡大滿貫八強對陣:孫穎莎內戰,王曼昱對韓朱雨玲

      五姑娘臺球
      2026-02-25 21:38:38
      小馬寶出生三天眼睛睜開,嘴巴好大,特別像馬筱梅,引發網友熱議

      小馬寶出生三天眼睛睜開,嘴巴好大,特別像馬筱梅,引發網友熱議

      魔都姐姐雜談
      2026-02-25 19:10:29
      1比3爆冷出局!21歲日本女單主力遭淘汰,孫穎莎沖冠之路有大勁敵

      1比3爆冷出局!21歲日本女單主力遭淘汰,孫穎莎沖冠之路有大勁敵

      卿子書
      2026-02-25 08:58:03
      浙江一家四口新年出游住4晚民宿,退房后垃圾帶走、地板拖凈、床鋪整齊;福建房東:打開門被震驚了,超出我認知,素質太高了

      浙江一家四口新年出游住4晚民宿,退房后垃圾帶走、地板拖凈、床鋪整齊;福建房東:打開門被震驚了,超出我認知,素質太高了

      極目新聞
      2026-02-25 14:04:21
      橘子再次被關注!醫生發現:糖尿病患者常吃橘子,或出現5種變化

      橘子再次被關注!醫生發現:糖尿病患者常吃橘子,或出現5種變化

      張醫師健康趣談
      2026-02-25 16:14:32
      女議員惡評谷愛凌:在美國出生+享受自由卻不尊重美國 還敢回到美國

      女議員惡評谷愛凌:在美國出生+享受自由卻不尊重美國 還敢回到美國

      TVB的四小花
      2026-02-25 15:27:35
      “茶幾”正在退出中國家庭,學廣東人這樣做,實用性讓人大開眼界

      “茶幾”正在退出中國家庭,學廣東人這樣做,實用性讓人大開眼界

      室內設計師有料兒
      2026-02-19 11:17:18
      美國記者批谷愛凌傲慢,TNT著名主持回擊:憑什么要對成就故作謙虛

      美國記者批谷愛凌傲慢,TNT著名主持回擊:憑什么要對成就故作謙虛

      硯底沉香
      2026-02-25 21:18:04
      美軍大規模撤離,伊朗導彈隨時落下,特朗普或制定“斬首”計劃?

      美軍大規模撤離,伊朗導彈隨時落下,特朗普或制定“斬首”計劃?

      你是我心中最美星空
      2026-02-26 00:55:41
      2026-02-26 05:03:00
      CreateAMind incentive-icons
      CreateAMind
      CreateAMind.agi.top
      1240文章數 18關注度
      往期回顧 全部

      科技要聞

      “機器人只跳舞,沒什么用”

      頭條要聞

      夫妻晚5秒錯過免費高速付1700元:氣得我不得了

      頭條要聞

      夫妻晚5秒錯過免費高速付1700元:氣得我不得了

      體育要聞

      勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

      娛樂要聞

      黃曉明新戀情!與小22歲美女同游新加坡

      財經要聞

      上海樓市放大招,地產預期別太大

      汽車要聞

      750km超長續航 2026款小鵬X9純電版將于3月2日上市

      態度原創

      數碼
      游戲
      房產
      手機
      藝術

      數碼要聞

      三星發布 Galaxy Buds 4 與 Buds 4 Pro 耳機產品

      《如龍極3》中文配音訪談:中文配音與本地化并非易事

      房產要聞

      海南樓市春節熱銷地圖曝光!三亞、陵水又殺瘋了!

      手機要聞

      超大核飆到4.74GHz!三星Galaxy S26系列首發第五代驍龍8至尊版for Galaxy

      藝術要聞

      這些作品太美了,仙氣飄飄,三位大咖不容錯過!

      無障礙瀏覽 進入關懷版