網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

生成式貝葉斯濾波和參數(shù)學(xué)習

2026-02-09 00:13:15　來源: CreateAMind

上海舉報

分享至

Generative Bayesian Filtering and Parameter Learning

https://arxiv.org/pdf/2511.04552

摘要

生成貝葉斯濾波（Generative Bayesian Filtering, GBF）為復(fù)雜非線性非高斯狀態(tài)空間模型的后驗推斷提供了一個強大而靈活的框架。我們的方法將生成貝葉斯計算（Generative Bayesian Computation, GBC）擴展到動態(tài)場景，利用深度神經(jīng)網(wǎng)絡(luò)驅(qū)動的基于仿真的方法實現(xiàn)遞歸后驗推斷。GBF 無需顯式密度評估，因此在觀測分布或狀態(tài)轉(zhuǎn)移分布難以解析處理時尤為有效。為解決參數(shù)學(xué)習問題，我們引入了生成吉布斯采樣器（Generative-Gibbs sampler），該采樣器通過從隱式全條件分布中迭代采樣各變量，繞過顯式密度評估。這一技術(shù)具有廣泛的適用性，能夠?qū)崿F(xiàn)具有難以處理密度的層次貝葉斯模型（包括狀態(tài)空間模型）中的推斷。我們通過模擬研究和實證研究評估了所提出方法的性能，包括 α-穩(wěn)定隨機波動率模型的估計。研究結(jié)果表明，在處理難以處理的狀態(tài)空間模型時，GBF 在準確性和穩(wěn)健性方面顯著優(yōu)于現(xiàn)有的無似然方法。

1 引言

狀態(tài)空間模型是宏觀經(jīng)濟學(xué)和金融學(xué)中時間序列分析的基石，在自然科學(xué)和社會科學(xué)領(lǐng)域也有廣泛應(yīng)用，適用于需要從含噪或不完整數(shù)據(jù)中推斷潛在動態(tài)過程的場景。

難處理模型在各個領(lǐng)域均有出現(xiàn)。例如，在金融學(xué)中，α-穩(wěn)定分布常被用于捕捉資產(chǎn)收益率呈現(xiàn)的不對稱厚尾特征（Mandelbrot，1963；Mittnik and Rachev，1993），然而這些分布缺乏閉式密度表達式。在宏觀經(jīng)濟學(xué)中，非線性DSGE模型（Fernández-Villaverde et al.，2016）依賴于數(shù)值求解的均衡條件，導(dǎo)致轉(zhuǎn)移動態(tài)僅能隱式定義，因此在分析上難以處理。類似的挑戰(zhàn)也出現(xiàn)在生物學(xué)中，機制模型如Lotka-Volterra捕食者-被捕食者系統(tǒng)（Lotka，1925；Volterra，1926）會導(dǎo)出具有難處理轉(zhuǎn)移核的狀態(tài)空間模型。更一般地說，每當狀態(tài)空間模型的觀測或轉(zhuǎn)移分量通過某個數(shù)值黑盒模型定義時，便會出現(xiàn)難處理性。

雖然缺乏易處理的密度排除了基于標準似然的推斷，但許多難處理的狀態(tài)空間模型仍然允許從生成過程進行高效模擬。這一重要特征促使了在此類情境下采用近似貝葉斯計算方法。特別是，Jasra等人（2012）引入了ABC粒子濾波器，用于在似然難處理的狀態(tài)空間模型中進行狀態(tài)推斷；而Jasra等人（2013）提出了一種粒子MCMC方法，該方法利用ABC-PF構(gòu)建似然估計量，以對狀態(tài)和模型參數(shù)進行聯(lián)合推斷。

盡管這些方法具有理想的漸近收斂性質(zhì)——我們將在后文詳細討論——但它們在有限樣本中的性能仍未得到充分理解。尤其是ABC-PF的準確性和可靠性對若干實施選擇高度敏感。這包括用于比較模擬數(shù)據(jù)和觀測數(shù)據(jù)的距離度量的定義、控制接受與否的容差閾值的選擇，以及所使用的粒子數(shù)量。增加粒子數(shù)量并降低容差可以改善后驗近似效果。然而，這種組合在實際中往往在計算上不可行，而次優(yōu)的參數(shù)調(diào)整可能導(dǎo)致有偏估計和高度不穩(wěn)定的后驗近似，從而引發(fā)對實證應(yīng)用穩(wěn)健性的擔憂。此外，這些問題還因粒子濾波器所存在的、已有充分記錄的問題（特別是權(quán)值退化和樣本貧化，參見例如Li et al., 2014）而加劇。

為解決這些擔憂，已有多種基礎(chǔ)ABC-PF的變體被提出（將在第2.2節(jié)中回顧），每種都旨在改進理論保證或?qū)嶋H性能。盡管如此，這些工具從根本上仍然受限于ABC和SMC方法的結(jié)構(gòu)性局限。

然而，當轉(zhuǎn)換到狀態(tài)空間背景時，GBC呈現(xiàn)出兩個結(jié)構(gòu)性局限。首先，它本質(zhì)上是靜態(tài)的，為固定數(shù)據(jù)集而非順序演化的觀測而設(shè)計。其次，它假設(shè)數(shù)據(jù)與參數(shù)之間存在直接聯(lián)系。這兩種假設(shè)都與狀態(tài)空間建模不兼容——在狀態(tài)空間建模中，諸如濾波等推斷任務(wù)需要對潛在狀態(tài) X t
t進行遞歸更新，并且未知參數(shù)通常僅通過這些潛在過程間接影響觀測。因此，在本文中，我們通過擴展GBC以支持遞歸推斷并適應(yīng)分層貝葉斯依賴關(guān)系，來應(yīng)對這兩個局限性。

1.1 貢獻與結(jié)構(gòu)

我們引入了一種新穎的狀態(tài)空間推斷與學(xué)習框架，該框架適用于所有能以方程（1）和（2）所示形式表達的模型——無論其噪聲分布或轉(zhuǎn)移函數(shù)與觀測函數(shù)的具體形式如何——只要能夠從該模型進行模擬。因此，該框架也涵蓋了具有難處理密度函數(shù)的模型。

我們的方法立足于生成式貝葉斯計算，并將其擴展到動態(tài)情境。在此情境中，問題的結(jié)構(gòu)要求對潛在狀態(tài)序列 ( X t )
的后驗分布進行遞歸更新。最終目標是重構(gòu)關(guān)鍵分布，如濾波分布、預(yù)測分布和平滑分布。我們既考慮了參數(shù)向量已知的情況，也考慮了參數(shù) θ 未知且必須從先驗分布 p ( θ )
出發(fā)，通過數(shù)據(jù)推斷的情況。

我們的生成式濾波器（簡稱Gen-Filter）旨在成為現(xiàn)有ABC-PF方法的一種有前景的替代方案。兩種方法都只需要具備從數(shù)據(jù)生成過程進行模擬的能力。然而，與ABC-PF不同——ABC-PF由于使用接受閾值，提供的樣本來自于一個近似的、本質(zhì)上存在偏差的濾波分布——生成式濾波器允許從真實的濾波分布中采樣。只要訓(xùn)練數(shù)據(jù)集足夠大，且用于近似逆CDF映射的神經(jīng)網(wǎng)絡(luò)具有足夠的表達能力，這一結(jié)論就成立。設(shè)計一個有效的神經(jīng)網(wǎng)絡(luò)架構(gòu)仍然是我們方法中的核心挑戰(zhàn)。與Polson和Sokolov（2023）的研究一致，我們采用分位數(shù)神經(jīng)網(wǎng)絡(luò)作為我們的基線方法。我們也探索了其他潛在方法，包括O’Hagan和Ro?ková（2025）提出的貝葉斯替代方案。

我們的結(jié)果表明，只要訓(xùn)練數(shù)據(jù)集足夠大，標準的深度學(xué)習架構(gòu)能夠提供準確可靠的性能。

這通常不構(gòu)成限制，因為在大多數(shù)情況下，從模型生成數(shù)據(jù)在計算上是高效且廉價的。

雖然我們的生成式濾波器（Gen-Filter）可以自然地用于構(gòu)建似然函數(shù)的估計量，從而能夠以類似于粒子馬爾可夫鏈蒙特卡羅算法的方式對潛在軌跡和未知參數(shù)進行聯(lián)合推斷，但我們還開發(fā)了一種創(chuàng)新的采樣策略。這種策略提供了顯著更高的計算效率和卓越的靈活性，我們稱之為生成式吉布斯采樣器。

通過生成式吉布斯采樣器，我們將生成式貝葉斯計算方法擴展到分層貝葉斯建模，即擴展到具有多層潛在結(jié)構(gòu)和復(fù)雜參數(shù)依賴關(guān)系的場景。

與傳統(tǒng)吉布斯采樣類似，生成式吉布斯方法通過迭代地從模型參數(shù)的全條件分布中抽樣來生成后驗樣本。至關(guān)重要的是，與經(jīng)典方法不同，所有全條件分布均通過隱式生成模型進行近似，從而使得在原本全條件分布解析難處理的場景中仍能進行吉布斯采樣。這使得生成式吉布斯采樣器具有廣泛的適用性，并且對難處理的狀態(tài)空間模型尤為有利。我們證明生成式吉布斯采樣器能夠獲得與傳統(tǒng)馬爾可夫鏈蒙特卡羅方法一致的后驗近似結(jié)果。

本文的結(jié)構(gòu)如下：第二節(jié)回顧了使用近似貝葉斯計算方法和生成式貝葉斯計算在狀態(tài)空間建模方面的最新進展。第三節(jié)介紹生成式貝葉斯濾波的概念，并提出兩種算法：生成式濾波器和預(yù)訓(xùn)練生成式濾波器。它們的性能通過第三節(jié)中的模擬研究進行評估，并與現(xiàn)有濾波技術(shù)進行比較。第四節(jié)討論模型參數(shù)未知且必須與潛在軌跡聯(lián)合推斷的場景。為此，我們提出生成式吉布斯采樣器，并展示如何以前向濾波后向采樣的策略形式有效應(yīng)用于一般狀態(tài)空間模型。生成式吉布斯采樣器的模擬結(jié)果在第五節(jié)中報告。最后在第六節(jié)中，我們使用金融數(shù)據(jù)進行實證應(yīng)用。隨后是結(jié)論部分，總結(jié)主要發(fā)現(xiàn)并討論未來研究的潛在方向。

2 背景 2.1 狀態(tài)空間模型中的序列推斷

在這一遞歸過程中，核心思想是：在每個時間點 t，預(yù)測分布充當關(guān)于未來狀態(tài)和觀測的先驗分布，當新數(shù)據(jù)通過濾波更新變得可用時，該先驗分布將隨之被精細化。

狀態(tài)空間模型中精確且高效的推斷僅在有限情況下可行，例如線性高斯模型，其最優(yōu)濾波解由著名的卡爾曼濾波器給出（Kalman, 1960）。然而，實際上許多系統(tǒng)表現(xiàn)出非線性動態(tài)和/或非高斯噪聲，使得精確推斷成為不可能。因此，人們開發(fā)了各種近似推斷方法。在確定性方法中，有擴展卡爾曼濾波器（Maybeck, 1979）和無跡卡爾曼濾波器（Julier and Uhlmann, 1997），它們試圖通過線性化動態(tài)或近似分布，使狀態(tài)空間模型適應(yīng)卡爾曼濾波器的假設(shè)。盡管這些方法在某些情況下有效，但在存在強烈非線性或非高斯噪聲時，其精度會下降。另一方面，SMC算法（在該領(lǐng)域通常稱為粒子濾波器）已獲得了顯著地位。這些方法提供了一個靈活的、基于模擬的框架，用于近似復(fù)雜的后驗分布，能夠處理廣泛的非線性和非高斯狀態(tài)空間模型類別。

2.2 粒子濾波器與ABC

人們開發(fā)了替代的濾波策略，這些策略利用模型的生成結(jié)構(gòu)，而非依賴于顯式的似然計算。

其中一種方法是卷積粒子濾波器（Rossi and Vila，2006；Rossi and Vila，2009），它通過基于潛在狀態(tài)生成的條件偽觀測構(gòu)建核近似，來代替難以處理的似然函數(shù)。然而，這種方法可能效率低下，尤其是在高維情況下，并且對核帶寬的選擇敏感，當帶寬未適當調(diào)整時，性能往往不佳。

一般而言，核函數(shù)、距離度量或容差參數(shù)的選擇不當往往會放大粒子濾波方法固有的一些已知挑戰(zhàn)，特別是權(quán)重退化和樣本貧化。為了緩解這一問題，實踐者通常依賴于自適應(yīng)閾值調(diào)整、更平滑的核函數(shù)或信息豐富的低維匯總統(tǒng)計量，以維持非零的接受率并保持推斷過程的連續(xù)性。一些相關(guān)的例子包括：Alive ABC-PF（Jasra等人，2013），它通過在每一步確保固定數(shù)量的粒子被接受來緩解粒子退化問題；Plug-in Bandwidth ABC-PF（Calvet和Czellar，2014），被證明能以最優(yōu)衰減率收斂；以及ABC-Auxiliary PF（Vankov等人，2019），通過改進提議分布來提高效率。

與ABC-PF類似，我們的生成式濾波器通過利用模型的底層數(shù)據(jù)生成過程，避免直接進行密度計算。然而，它不依賴ABC方法典型的接受-拒絕機制，而是利用生成建模的最新進展，從濾波分布中高效采樣。我們將在下一節(jié)詳細介紹我們方法背后的方法論。

2.3 生成式貝葉斯計算
生成式貝葉斯計算方法通常依賴于隱式分布。這類分布的密度函數(shù)無法直接計算，但我們可以通過一個隨機生成器（也稱為傳輸映射）輕松地從其抽取樣本。該生成器將來自參考測度（如多元高斯分布或均勻分布）的樣本轉(zhuǎn)換為目標概率測度的樣本。在現(xiàn)代實現(xiàn)中，傳輸映射通常由深度神經(jīng)網(wǎng)絡(luò)參數(shù)化（Mohamed and Lakshminarayanan，2016）。

這種采樣技術(shù)在應(yīng)對傳統(tǒng)貝葉斯計算方法的關(guān)鍵局限方面證明特別有價值，尤其是解決了對顯式密度計算的依賴以及與迭代模擬算法（如馬爾可夫鏈蒙特卡洛）相關(guān)的高計算負擔。例如，Titsias 和 Ruiz（2019）利用隱式變分分布來擴展可容許變分近似的族類，從而實現(xiàn)了比標準參數(shù)形式更靈活、更具表現(xiàn)力的后驗表示。

在本文中，我們所說的生成式貝葉斯計算更精確地指代那些將后驗本身建模為隱式分布的方法，其使用傳輸映射直接從相應(yīng)的后驗概率測度生成樣本。近年來已有越來越多的研究探討了參數(shù)化傳輸映射的各種神經(jīng)網(wǎng)絡(luò)架構(gòu)。Wang 和 Ro?ková（2023）使用條件貝葉斯生成對抗網(wǎng)絡(luò)來學(xué)習給定任意觀測數(shù)據(jù)向量下的后驗分布的生成模型。Polson 和 Sokolov（2023）利用隱式分位數(shù)網(wǎng)絡(luò)對給定數(shù)據(jù)下單變量參數(shù)的條件分位數(shù)函數(shù)進行建模，從而實現(xiàn)了直接的后驗采樣；而 Kim 等人（2025）則將這一思想推廣到多變量設(shè)置，允許從貝葉斯可信集直接采樣。在另一條相關(guān)的研究方向上，Sharrock 等人（2024）采用基于條件分數(shù)的擴散模型進行后驗采樣。

3 生成式貝葉斯濾波

3.1 生成式濾波器

3.2 預(yù)訓(xùn)練生成式濾波器

生成式濾波器的主要優(yōu)勢在于其多功能性，即能夠處理廣泛的狀態(tài)空間模型，而無需對底層隨機過程（尤其是平穩(wěn)性）施加嚴格假設(shè)。盡管如此，當平穩(wěn)性條件滿足時，我們可以利用這一特性。

3.4 模擬研究 3.4.1 線性高斯模型

我們首先在線性高斯狀態(tài)空間模型上評估新開發(fā)的方法，該模型作為一個易于理解且分析上可處理的基準。如第2.1節(jié)所述，在此設(shè)置下，濾波問題可以使用卡爾曼濾波器精確求解。模型定義如下：

線性高斯案例中觀察到的出色性能為本文引入的濾波策略的有效性提供了有力證據(jù)。為進一步證明其普遍適用性，我們將分析擴展到一個基于一類非線性、非高斯狀態(tài)空間模型（通常稱為隨機波動率模型）的模擬示例。

盡管迄今為止，收益率新息項的高斯設(shè)定是最常見的選擇，這主要是因為其能帶來分析上的易處理性、良好的似然函數(shù)形式以及直接的模擬特性，但金融領(lǐng)域的經(jīng)驗證據(jù)（例如 Cont, 2001; Chakraborti 等人, 2011; Ratliff-Crain 等人, 2023）一致表明，資產(chǎn)收益率表現(xiàn)出超額峰度、厚尾和偏度等特征，這些是高斯分布無法再現(xiàn)的。因此，從 Mandelbrot (1963)、Fama (1965) 以及 Mittnik 和 Rachev (1993) 的開創(chuàng)性工作開始，α-穩(wěn)定分布因其有趣的特性而在該領(lǐng)域廣受歡迎。具體而言， α < 2
的穩(wěn)定分布自然地容納了冪律尾部，而偏度參數(shù) β β允許對不對稱性進行建模。這些特性使得 α-穩(wěn)定模型非常適合捕捉高頻和危機時期金融數(shù)據(jù)中觀察到的極端事件和不對稱風險模式，為風險度量、期權(quán)定價和投資組合壓力測試提供了更現(xiàn)實的基礎(chǔ)。

圖2展示了三種信息分布的可視化對比。前兩種情形允許使用標準粒子濾波器作為參考后驗，我們可以借此評估生成式濾波器。相比之下，在第三種情形中，似然函數(shù)無法以閉式求解，因此標準粒子濾波器不適用。因此，我們采用粒子數(shù) N = 100 , 000 的ABC-PF作為基準，以比較不同濾波策略。

如前一節(jié)所述，我們在每種信息分布設(shè)定下模擬了100個場景。對于柯西分布情形，我們剔除概率小于萬分之一的抽樣值。在該分布中，此類罕見事件會導(dǎo)致絕對值極大的觀測值；這些極端異常值在實際場景中不僅不現(xiàn)實，也可能導(dǎo)致所有無似然濾波方法失效。類似地，對于厚尾非對稱α-穩(wěn)定分布情形，我們剔除概率低于十萬分之一的抽樣值。

圖3展示了在柯西信息下的一個模擬場景中，各方法估計的潛在軌跡。圖中顯示，即使在這種ABC-PF表現(xiàn)不佳的厚尾設(shè)定中，我們的策略仍與粒子濾波器提供的真實估計保持一致。

4 參數(shù)學(xué)習

至此，我們一直假設(shè) θ ∈ Θ 是已知的；然而，在實際應(yīng)用中這很少見。因此，我們現(xiàn)在提出在生成式濾波器框架內(nèi)對潛在軌跡和未知參數(shù)進行聯(lián)合推斷的策略。

在無似然設(shè)定下，大多數(shù)工作集中于獨立于軌跡估計的參數(shù)推斷。例如，Dean 等人（2014）、Martin 等人（2014）、Y?ld?r?m 等人（2015）和 Martin 等人（2019）開發(fā)了基于 ABC 的方法，這些方法主要針對靜態(tài)參數(shù) θ θ進行推斷，而將潛在軌跡視為次要或隱式邊緣化處理。更專注于同時處理參數(shù)和軌跡推斷的嘗試包括 Jasra 等人（2013）以及隨后的 Vankov 等人（2019），他們提出使用粒子馬爾可夫鏈蒙特卡羅算法來近似聯(lián)合后驗分布 p ( θ , x 0 : T ∣ y 1 : T），其中 ABC 粒子濾波器被用作似然估計器。

原則上，也可以在生成式貝葉斯濾波框架內(nèi)構(gòu)建粒子馬爾可夫鏈蒙特卡羅類算法，其中生成式濾波器代替粒子濾波器作為似然估計器。然而，我們追求更具計算優(yōu)勢的方法。具體而言，我們提出兩種高效的、完全無需密度計算的方法，它們適用于廣泛的狀態(tài)空間模型。

第一種方法將參數(shù)和潛在軌跡的聯(lián)合后驗分布分解為：

從觀測過程中識別合適的匯總統(tǒng)計量可能具有挑戰(zhàn)性。例如，Martin 等人（2019）探索了基于輔助似然的方法，其中匯總統(tǒng)計量從一個比真實模型更容易估計的輔助模型中獲得；而 Maneesoonthorn 等人（2024）則利用了來自多個數(shù)據(jù)源的匯總統(tǒng)計量。

一種更穩(wěn)健且直觀的策略是采用同時納入潛在軌跡信息的匯總統(tǒng)計量。然而，在實踐中實現(xiàn)這一方法具有挑戰(zhàn)性，因為狀態(tài)序列是不可觀測的，因此這類匯總統(tǒng)計量無法像基于觀測數(shù)據(jù)的匯總統(tǒng)計量那樣直接計算。為解決這一問題，我們開發(fā)了一種新穎的貝葉斯計算方法，稱為 Gen-Gibbs 采樣器。該方法廣泛適用于貝葉斯推斷，尤其適用于層次模型——在層次模型中，由于存在多個層次，僅基于觀測數(shù)據(jù)為每個潛變量構(gòu)建信息性匯總統(tǒng)計量十分困難。在這種情況下，可以利用層次結(jié)構(gòu)本身來設(shè)計更有效的匯總統(tǒng)計量并提高計算效率。我們將在下一節(jié)詳細討論該方法。

5 生成式吉布斯采樣

生成式吉布斯采樣指的是一種廣泛適用的采樣策略，它將馬爾可夫鏈蒙特卡羅算法的嚴謹特性與生成建模的最新進展相結(jié)合，從而在一個基于原理的貝葉斯計算框架內(nèi)利用先進的機器學(xué)習技術(shù)。

類似于吉布斯采樣，生成式吉布斯采樣算法通過迭代地從參數(shù)的全條件分布中抽樣來近似后驗分布。與經(jīng)典方法需要解析推導(dǎo)條件分布不同，生成式吉布斯采樣利用深度學(xué)習模型來近似這些條件分布的分位數(shù)函數(shù)。

上述采樣策略在分層貝葉斯模型中尤其有用，包括狀態(tài)空間模型，其中一些參數(shù)并不直接與數(shù)據(jù)相關(guān)聯(lián)。舉例來說，假設(shè) θ θ控制潛在動態(tài)，因此僅直接依賴于未觀測狀態(tài)而非觀測本身。在這種情況下，狀態(tài)空間模型可以寫成一個兩層次的分層模型

因此，在狀態(tài)空間模型中應(yīng)用生成式吉布斯采樣器可簡化為一種針對潛在狀態(tài)的前向濾波后向采樣策略，并與吉布斯采樣相結(jié)合

5.1 模擬研究

5.1.1 線性高斯模型

對于單個模擬過程，圖 4b 和 4c 表明 Gen-Gibbs 后驗與傳統(tǒng)吉布斯采樣獲得的后驗高度吻合。特別值得關(guān)注的是圖 4a 展示的混合和收斂行為，該圖表明 Gen-Gibbs 鏈實現(xiàn)了快速混合和穩(wěn)定收斂，與經(jīng)典方法相當。值得注意的是，圖 4b 和 4c 還顯示，當以相同的參數(shù)值初始化時，兩種方法在近似相同的步數(shù)內(nèi)收斂。這表明所提出的方法不僅能以高精度復(fù)現(xiàn)后驗分布，而且保持了理想的抽樣性質(zhì)，使其成為傳統(tǒng)吉布斯采樣的可行替代方案，尤其是在后者無法直接使用時。

在所有 100 個模擬過程中重復(fù)該分析，我們發(fā)現(xiàn)兩種方法得到的未知參數(shù)的后驗均值和分位數(shù)高度一致，如圖 5 所示，表 5 報告的覆蓋值也證實了這一點。此外，兩種方法估計的潛在軌跡表現(xiàn)出可比較的均方根誤差（RMSE）和覆蓋值，如圖 6 所示。

總體而言，這些結(jié)果極具前景，促使我們將分析擴展到更具挑戰(zhàn)性的場景，特別是像我們處理已知參數(shù)情況時所做的那樣，擴展到非線性、非高斯示例。

表 7 報告了在幾種參數(shù)配置下，對 100 個模擬隨機波動率過程取平均后的模型參數(shù)和狀態(tài)序列的估計結(jié)果。表中報告的結(jié)果表明，所提出的方法提供了非常準確的估計，且這一穩(wěn)健性能在所有配置下始終保持。特別是，該方法即使在具有重尾和強非對稱特征的挑戰(zhàn)性場景下，以及在 α 接近 2 且 β 難以識別的情形下，都表現(xiàn)良好。

我們想特別強調(diào) Gen-Gibbs 方法的一個特別吸引人的特性，即其靈活性。一旦完成算法 3 描述的預(yù)訓(xùn)練階段，所學(xué)得的映射函數(shù)可以在 Gen-Gibbs 采樣器（算法 4）中重復(fù)使用，以估計屬于同一類狀態(tài)空間系統(tǒng)的模型，而幾乎不產(chǎn)生額外的計算成本。換句話說，只需提供新的觀測數(shù)據(jù)序列，就可以快速完成狀態(tài)和參數(shù)估計。這一特性相比傳統(tǒng) ABC 方法提供了顯著的計算優(yōu)勢，因為傳統(tǒng) ABC 方法需要對每個新數(shù)據(jù)集進行完整的重新估計程序。

6 實證研究

對金融時間序列的實證研究持續(xù)揭示了一系列反復(fù)出現(xiàn)的模式，通常稱為典型事實，任何現(xiàn)實的資產(chǎn)定價模型都應(yīng)致力于重現(xiàn)這些特征。這些經(jīng)驗規(guī)律已在廣泛的資產(chǎn)、資產(chǎn)類別和市場中得到記錄，對支撐傳統(tǒng)金融模型（如期權(quán)定價的Black-Scholes框架（Black和Scholes，1973））的同方差性和正態(tài)分布收益率等經(jīng)典假設(shè)構(gòu)成了重大挑戰(zhàn)。在一項開創(chuàng)性貢獻中，Cont（2001）系統(tǒng)地歸納了十一個此類特征。α-穩(wěn)定隨機波動率模型能夠復(fù)現(xiàn)其中多個典型事實，包括：線性自相關(guān)缺失、條件與非條件厚尾性、收益/損失不對稱性、波動率聚集以及絕對收益率自相關(guān)的緩慢衰減。此外，本文引入的生成式貝葉斯濾波框架為開發(fā)和估計能夠捕捉Cont（2001）識別出的其余典型事實的更復(fù)雜模型奠定了基礎(chǔ)。

作為展示這些特征的金融時間序列示例，我們考慮由ProShares1發(fā)行的Short VIX Short-Term Futures ETF，通常簡稱為SVXY。該產(chǎn)品旨在提供對S&P 500 VIX短期期貨指數(shù)的反向敞口，該指數(shù)跟蹤短期VIX期貨的持續(xù)滾動持倉。因此，當市場波動率下降且VIX期貨曲線保持期貨升水時，SVXY會產(chǎn)生正收益。

實際上，市場波動率容易發(fā)生突變，這會導(dǎo)致VIX期貨價格急劇跳躍，并相應(yīng)地給SVXY等反向波動率產(chǎn)品帶來巨大損失。雖然股市持續(xù)平靜的時期可能帶來平穩(wěn)的正收益，但市場壓力時期可能導(dǎo)致波動率迅速上升和重大損失。此類事件發(fā)生在2018年2月所謂的“波動率末日”期間，當時股市波動率的突然飆升導(dǎo)致VIX期貨出現(xiàn)前所未有的暴漲。在單個交易日中，多種做空波動率產(chǎn)品經(jīng)歷了嚴重回撤，其中一些最終被清盤（例如，瑞信XIV交易所交易票據(jù)的關(guān)閉）。在此事件之后，包括SVXY在內(nèi)的許多波動率掛鉤交易所交易產(chǎn)品經(jīng)歷了重大重組。特別是，ProShares降低了該基金的敞口，將其杠桿從-1倍調(diào)整為-0.5倍，旨在減輕尾部風險。由于這一調(diào)整可能改變了收益生成過程，我們將分析重點放在2014年3月至2018年4月期間（共1000個交易日），這一時間段包含了2018年2月的沖擊，同時排除了重組后的制度。

我們將原始價格序列轉(zhuǎn)換為去均值后的日度對數(shù)收益率，具體如下：

由于從后驗預(yù)測分布生成的收益率成功捕捉了實際收益率的動態(tài)特性，研究結(jié)果強有力地證明，即使在似然函數(shù)解析上難以處理且標準貝葉斯計算技術(shù)無法應(yīng)用的環(huán)境中，所提出的估計框架仍能為潛在狀態(tài)和參數(shù)提供可靠的推斷。通過克服這些局限性，我們的方法極大地擴展了可在貝葉斯范式下進行估計的狀態(tài)空間模型類別。這進而使得我們能夠使用更豐富、更現(xiàn)實的模型設(shè)定，這些設(shè)定包含了常因計算便利性而被忽視的特征，例如市場突然的負向波動以及金融收益率中其他形式的極端行為。

7 討論

在本文中，我們提出了一種用于狀態(tài)空間模型濾波與參數(shù)學(xué)習的新穎框架。我們的方法在模型設(shè)定導(dǎo)致復(fù)雜的先驗與似然系統(tǒng)（使得傳統(tǒng)的MCMC和SMC方法難以甚至無法應(yīng)用）的情況下，例如難處理的狀態(tài)空間模型，證明尤其有價值。我們證明，只要能夠從模型進行模擬，無論噪聲分布或轉(zhuǎn)移函數(shù)與觀測方程的函數(shù)形式如何，通過我們的生成式濾波器方法，對潛在狀態(tài)的估計仍然是可行的。我們還提供了預(yù)訓(xùn)練版本，為需要快速更新濾波分布的應(yīng)用——例如實時目標跟蹤和高頻波動率監(jiān)測，且在可以合理假設(shè)潛在過程平穩(wěn)且發(fā)射分布時齊的條件下——提供了一種高效的替代方案。與基準ABC-PF相比，這兩種方法均表現(xiàn)出更優(yōu)的性能，實現(xiàn)了更高的準確性、更好的覆蓋率以及與真實后驗更近的接近度。

對于模型參數(shù)未知且必須與潛在狀態(tài)聯(lián)合推斷的場景，我們開發(fā)了生成式吉布斯采樣器。該方法提供了一種完全無需密度計算的采樣方案，能夠在具有復(fù)雜分層結(jié)構(gòu)和難處理密度的模型中實現(xiàn)貝葉斯推斷，其中某些類別的狀態(tài)空間模型是其特例。當標準MCMC技術(shù)可以應(yīng)用時，生成式吉布斯采樣器能夠獲得可比較的結(jié)果，證明了其作為通用推斷工具的有效性和穩(wěn)健性。

我們的生成式貝葉斯濾波框架具有廣泛的跨學(xué)科適用性，可用于任何允許狀態(tài)空間表示的模型。在本工作中，我們專注于金融應(yīng)用，特別是波動率估計——這是濾波文獻中一個長期存在的挑戰(zhàn)。正如Cont等人（2023）所記錄的，金融收益率中觀察到的復(fù)雜動態(tài)很難用具有嚴格假設(shè)的簡單模型捕捉，盡管這些模型仍然是有用的基準。我們的框架為更靈活、更現(xiàn)實的建模打開了大門。特別是，我們展示了采用α-穩(wěn)定分布能夠捕捉金融收益率中一些眾所周知的典型事實，并增強波動率估計。我們邀請經(jīng)濟學(xué)家和量化研究人員進一步探索我們的框架，并將我們的分析擴展到更豐富的動態(tài)特性，如跳躍、杠桿效應(yīng)和其他非線性。重現(xiàn)我們結(jié)果所需的所有材料可在第一作者的GitHub倉庫3中找到。

采用我們框架的研究者應(yīng)注意，該方法在深度學(xué)習模型訓(xùn)練期間可能涉及相當大的計算成本。然而，通過利用高性能計算資源（如GPU）和并行處理，這一負擔可以得到極大緩解。盡管如此，我們的結(jié)果表明，使用標準計算設(shè)置仍能實現(xiàn)出色的性能。此外，在預(yù)訓(xùn)練生成式濾波器和生成式吉布斯采樣的背景下，此計算成本僅產(chǎn)生一次；訓(xùn)練完成后，濾波和參數(shù)學(xué)習的速度可與經(jīng)典粒子濾波器和粒子馬爾可夫鏈蒙特卡羅方法相媲美。特別是，在訓(xùn)練階段學(xué)習到的映射可以輕松復(fù)用于估計整類狀態(tài)空間模型，只需提供新數(shù)據(jù)即可。與傳統(tǒng)ABC方法相比，這是一個特別吸引人的優(yōu)勢，因為傳統(tǒng)方法必須在數(shù)據(jù)集改變時重新初始化估計過程。

另一個相關(guān)點是，我們對生成式貝葉斯濾波框架的實現(xiàn)主要依賴于分位數(shù)神經(jīng)網(wǎng)絡(luò)來學(xué)習用于從目標分布生成樣本的逆累積分布函數(shù)映射。因此，它受到該技術(shù)固有局限性的制約。盡管分位數(shù)神經(jīng)網(wǎng)絡(luò)的使用并非嚴格必要，也可以采用其他隱式分位數(shù)方法，但神經(jīng)網(wǎng)絡(luò)的訓(xùn)練通常需要仔細的調(diào)優(yōu)和驗證。

在本文中，我們專注于單變量情況。作為未來研究的一部分，我們旨在將所提出的框架擴展到多維狀態(tài)空間模型，其中 Y t
和 X t
均為向量值。這一方向的動機來自Kim等人（2025）最近的工作，他們將生成式貝葉斯計算方法推廣到多變量設(shè)置。

原文鏈接：https://arxiv.org/pdf/2511.04552

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.