![]()
導語
基于有效信息的因果涌現表明,在動力學系統中宏觀動力學可能比微觀動力學表現出更強的因果效應。然而,因果涌現的識別與有效信息的最大化均依賴于粗粒化策略的定義,這構成了該領域的核心挑戰。近期提出的基于近似動力學可逆性的因果涌現框架,通過奇異值分解技術規避了粗粒化依賴,但該方法目前僅限于離散狀態的轉移概率矩陣。為解決這一局限,本文針對高斯迭代系統提出了一種基于動力學可逆性的因果涌現量化框架,通過分析前向與后向動力學中逆協方差矩陣的奇異值分解來實現。
為系統梳理因果涌現領域的最新進展,北京師范大學系統科學學院教授、集智俱樂部創始人張江老師領銜發起,組織對該主題感興趣的研究者與探索者共同研讀前沿文獻、交流研究思路。讀書會將于2026年2月22日起每周日上午(創建讀書會暫定時間為10:00-22:00)線上開展,持續約10周,包含主講分享與討論交流,并提供會后視頻回放,誠邀相關領域研究者及跨學科興趣者參與。
關鍵詞:因果涌現 (Causal emergence),近似動力學可逆性(approximate dynamical reversibility),高斯迭代系統(Gaussian iterative systems),奇異值分解(singular value decomposition),逆協方差矩陣(inverse covariance matrix)
劉凱威丨作者
張江丨審校
![]()
論文題目:Singular-value-decomposition-based causal emergence for Gaussian iterative systems 論文作者:劉凱威,潘琳莉,王志鵬,楊明哲,袁冰,張江 論文鏈接:https://journals.aps.org/pre/abstract/10.1103/mfct-sxn5 發表時間:2025年11月25日 論文來源:PHYSICAL REVIEW E
作者簡介:
簡介
什么是涌現?因果涌現理論框架給出了定量的刻畫:當一個系統可以被某種粗粒化方式簡化為一個更簡單的宏觀動力學(狀態數量更少),并且因果效應強度(以有效信息來衡量)會得到顯著的提升的時候,則該系統中就存在著涌現現象。
盡管這一定義簡單清晰,但是傳統因果涌現現象的討論卻大多受限于離散狀態的動力系統。近期,我們組發表在Physical Review E上的論文提出,當我們將系統擴展為連續狀態變量的馬爾可夫動力學時,則因果涌現現象就體現為對一個系統的降維,可以使得它的動力學的因果效應得到顯著增強,為了找到這種增強方法,我們只需要對系統的動力學和協方差矩陣同時進行奇異值分解。
因果涌現實例
下面來看三個例子:
![]()
例1:帶噪聲的三維螺旋曲線
![]()
圖1
圖1中展示了一個三維空間中的螺旋線旋轉模型(繞著豎直直線x1=x2=0旋轉),同時該旋轉的半徑以及高度x3都逐漸提升。與此同時,系統的運動帶有高斯噪聲。
這個運動軌跡可以由方程描繪:
其中,動力學系數A和噪聲的協方差矩陣∑如下圖所示:
![]()
其中A中的第三行第三列元素A(3,3)便控制著螺旋線在x3軸上的上升速度。當A(3,3)很小的時候(小于1),則系統便產生了較明顯的因果涌現現象:此時系統看起來沒有高度的提升,只存在較大的不確定的噪聲(下圖協方差學矩陣∑的∑33元素),而表現為一個在x1,x2平面上的螺旋線。所以,我們只要保留x1、x2兩個維度,就可以近乎完整地描述系統的旋轉過程,增加x3只會增加系統的噪聲和不確定性,故該系統在2維比3維存在更強的因果效應,存在因果涌現。
例2: 帶噪聲的馬爾薩斯人口增長模型
![]()
圖2
圖2模擬的是一個馬爾薩斯增長模型生成的增長曲線,該曲線的增長方程為也可以描述為(1)式,許多學者甚至是智庫對于人類發展遇到的在資源、環境、社會甚至國際局勢方面的諸多問題的研究與解釋,都可以溯源到該模型。該系統的動力學系數矩陣A如下圖所示:
![]()
可以明顯看出,系數矩陣的兩行完全相同。事實上,為了增加模型的冗余性(人為制造因果涌現的一種方式),我們給這兩個維度的變量增加了拷貝,如下圖:
![]()
這個系統中發生了因果涌現,是因為維度x1、x3高度相關,x2、x4高度相關,在存在噪聲的情況下,如果我們去除這兩個拷貝的變量,或直接將相關性強的維度求平均組合在一起,就可以起到降低噪聲的作用,使2維情況下的宏觀系統4維情況下微觀系統因果性更強。
例3: 布朗運動
![]()
圖3
圖3則是一個噪聲占主導的布朗運動,在統計物理中,該模型會被用于描述微觀分子的運動規律。雖然這些模型以及他們衍生模型,應用在在不同領域。
它同樣是由(1)式生成的10條樣本軌道,系數矩陣和協方差矩陣如下圖所示:
![]()
該系統中不同維度的噪聲不同,有的維度噪聲很小,有的維度卻很大。刪掉噪聲大的維度,保留噪聲小的維度,可以使整個系統噪聲減小,從保留的確定性強、噪聲小的維度、更容易觀察到系統的演化規律,說明這幾個保留的維度具有更強的因果性,這也是因果涌現存在的評判標準。
高斯迭代動力系統
那么,這三類系統的共性是什么呢?首先,它們都是高斯迭代系統,即:
![]()
其中f(xt)是變量確定的演化函數,是隨機噪聲的部分。
許多現實世界的復雜系統,無論是物理、生物、經濟還是社會,都表現出由確定性規律和隨機干擾相互作用構建的動力學。對于非線性函數,我們通常將其線性化以分析其局部性質,對于任意函數都可以通過泰勒展開在局部線性化,形如
![]()
或直接忽略掉常數項,簡寫為(1)式的形式。
我們稱之為線性高斯迭代系統,其中,對應xt附近的雅克比矩陣。我們可以看到隨著時間的推移,系統的噪聲無限累加,整個系統也會越來越不可預測。例如Logistic Map,Hanon Map,包括一些連續動力系統(如Kuramoto、SIR、捕食者),都可以近似成這種形式。即使是線性模型,也能描述豐富的物理規律,其實上面三幅圖描述的物理模型都只需要用一個線性的高斯迭代系統就可以有效的表達。
其次,在這三個例子中,我們都能夠找到某種粗粒化策略,將原系統簡化為一個更小維度的系統,從而讓因果效應提升。于是,關鍵問題是,我們如何找到這樣的粗粒化策略?特別是,針對一般的大型復雜系統,我們要如何找到呢?
近期,張江團隊基于他們構建的基于動力學可逆性和SVD方法的因果涌現量化方法就很好地解決了這個問題,并發表在PRE【1】上。簡單來說,針對一個給定的高斯迭代動力學系統,我們只需要對該系統的動力學和協方差矩陣做SVD分解,就可以找到判斷系統是否存在因果涌現,以及如何找到最優的粗粒化策略。然而,為什么可以如此簡單?我們又應該對誰做SVD分解呢?
因果性與可逆性
要想理解這個理論框架,首先,我們需要理解在一個給定的動力學系統中,因果性和可逆性是兩個密切相關的概念。我們分別介紹:
因果性
任何一個動力學都可以看作是一個因果模型。其中,前一時刻的狀態引起了后一時刻的狀態的變化,因此前一時刻的狀態是因變量,而后一時刻的狀態是果變量。本文所討論的因果性轉指在給定因果變量的前提下,因變量對果變量的因果影響的效應強弱,即如果因變量發生改變,果變量也跟著發生改變的明確程度。
![]()
圖4 我們在這里展示高斯迭代系統的因果效應強度(有效信息)與近似動力學可逆性(γ)的相關性,如圖1所示,每張圖的左側為因變量的分布,右側為果變量的分布。圖1從左到右,因果效應逐漸增強,近似動力學可逆性也在增強。上下對應的兩張圖中的動力學相同,但是輸入分布不同,因此它們的因果效應強度和動力學可逆性也都完全相同,即動力學可逆性只與動力學有關。
動力學可逆性
動力系統可以看作一個將前一時刻t的狀態映射到后一時刻t+Δt時刻狀態的函數。如果該映射是可逆的,我們就稱該動力學是可逆的。例如,一個不受外力的勻速直線運動模型就是可逆的動力學,它在任何兩個連續時刻之間的狀態映射是一一對應的:只要知道物體在t時刻的位置xt,規定速度v,就可以唯一確定它在t+Δt時刻的位置xt+Δt;與此同時知道t+Δt時刻的位置xt+Δt,我們同樣可以直接倒推出t時刻的位置xt。而這個回溯的過程可以視為一個速度為-v的逆向動力學,如圖所示。
![]()
也就是說,如果動力學是可逆的,就意味著整個過程可以沿時間逆推——相當于時間可以倒流。
我們只需在物理上逆轉運動方向,就能讓過程回溯。如同在勻速直線運動的例子中,將速度反向,物體就會沿著原來的路徑退回到起點,完全遵循逆動力學演化。
![]()
注:這里面的動力學可逆的概念與經典力學哈密頓系統中的可逆性存在著微妙的差別。在經典力學中,如果時間t反號,而動力學方程形式不變,則動力學是可逆的。我們這里的可逆性則要求只要動力學的Perron-Frobenius算符是可逆的就可以,因此我們的可逆性蘊含了力學中的可逆性。
近似動力學可逆性的量化
然而,現實中絕大多數動力學過程是不可逆的,尤其當存在隨機噪聲影響時。因此,不同動力學的可逆程度也有所不同,有些只是有輕微擾動但是接近可逆,有些則完全雜亂無章高度不可逆。但是如上面描述隨機微分方程的兩個路徑圖所示,我們會發現,對于含有高斯噪聲的動力學,上分噪聲的方差較小的動力學運動軌跡看起來更為平滑,變量的變化規律更易描述,直到任一時刻狀態變量xt,我們推測出前一時刻或后一時刻的狀態變量xt-1或xt+1將更容易。若噪聲方差較大,預測就更為困難。由此可見噪聲小的動力學將比噪聲大的動力學更接近可逆動力學。這就引出了“近似動力學可逆性”的概念。
![]()
圖5
張江團隊早在npj Complexity的這篇文章【2】中定義了“近似動力學可逆性”基于馬爾可夫鏈轉移概率矩陣(TPM)的奇異值分解,通過,σi表示TPM的奇異值,量化動力學接近可逆置換矩陣的程度。其局限在于該方法只適用于離散狀態的TPM矩陣,應用范圍較小且難以基于數據解決實際問題。
本文利用泛函分析中奇異值譜與傅里葉變換方法,拓展了近似可逆性的概念,應用于(1)式的高斯迭代系統中,定義如下:
![]()
其中pdet(·)表示矩陣·的偽行列式運算。Γα之所以可以看作是對近似可逆性的度量,是因為當系統的正向、逆向動力學中的不確定性(即協方差矩陣的行列式值)噪聲很大的時候,正向、逆向動力學的逆協方差矩陣(也叫精度矩陣)∑-1與A∑-1AT的行列式都會變得很小,動力學會變得高度不可逆。反之若系統正向、逆向動力學中的不確定噪聲很小,甚至趨于0的時候,∑-1與A ∑-1AT會變得很大甚至趨于無窮,此時系統動力學就十分接近可逆動力學,此時用去噪聲后的可逆動力學來近似高斯迭代系統則會變得有效。
這里,α是一個取值在0到2之間的參數,控制著正向動力學和逆向動力學在近似可逆性定義中的相對權重大小(如圖5所示)。如果α<1,則可逆性更依賴于逆向動力學,否則若1"},"displayMode":"inline","viewType":"inline"}}">α>1,則可逆性更偏重正向動力學。這種正向反向動力學的依賴剛好與有效信息定義中的確定性和簡并性起到了異曲同工的作用。通常,我們取1\"},\"displayMode\":\"inline\",\"viewType\":\"inline\"}}"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"mpa-font-style":"mkatyen316xq","style":"font-size: 15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"data-meta-block-props":"{\"blockId\":\"9ddfda7d-ef0a-4164-9395-ea3ca1fe779d\",\"blockType\":\"EQUATION_BLOCK\",\"initData\":{},\"props\":{\"data\":{\"equation\":\"\\\\alpha\"},\"displayMode\":\"inline\",\"viewType\":\"inline\"}}"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">α=1,表示動力學可逆性對正向和反向沒有偏好。
為了避免變量維度對動力學可逆性的影響過大,我們通常計算維度平均的可逆信息來優化指標,該指標是一個由奇異值決定的變量
![]()
這里rs,rκ 分別表示矩陣A∑-1AT,∑-1的秩,si和 κi分別表示矩陣∑-1AT和矩陣∑-1的第i個奇異值。
因果性與可逆性是密切相關的
事實上,張江團隊早在npj Complexity的這篇文章【2】中就已經在離散馬爾可夫鏈上發現了因果性與可逆性的密切關系。這主要體現為,因果性的量化指標有效信息在很多馬爾可夫動力學上都表現出與近似動力學可逆性指標的對數正相關的特性,參考:因果涌現與“時間倒流”。
在這篇PRE文章中,劉凱威等人進一步將這一結論擴展到了連續狀態的高斯迭代動力系統之中,并且給出了有效信息和近似動力學可逆性的解析表達式。
圖4中有效信息的下方也同樣展示了每一種映射對應的值(其中1\"},\"displayMode\":\"inline\",\"viewType\":\"inline\"}}"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"mpa-font-style":"mkatyen316xq","style":"font-size: 15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"data-meta-block-props":"{\"blockId\":\"9ddfda7d-ef0a-4164-9395-ea3ca1fe779d\",\"blockType\":\"EQUATION_BLOCK\",\"initData\":{},\"props\":{\"data\":{\"equation\":\"\\\\alpha\"},\"displayMode\":\"inline\",\"viewType\":\"inline\"}}"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">α=1),可以看出它與有效信息一樣會隨著迭代映射中的方差σ增大而減小,隨著系數a增大而增大,且只與動力學(因果機制p(xt+1|xt))有關,而與xt分布無關。這種觀察并非偶然,事實上我們可以得到一般性的結論:近似可逆性與有效信息的近似線性相關,即
![]()
其中表示近似相等,當A滿秩,且A∑-1AT=In即逆向動力學為為標準正態分布時,等號嚴格成立,為常數項。在附錄中存在詳細證明。由此可見,對于如(1)式的線性高斯噪聲動力系統而言,動力學的近似可逆性與因果效應強度存在著一定的等價性。
因果涌現
在文獻【2】中基于動力學近似可逆性的概念,張江等人提出了一種基于SVD分解的因果涌現量化定義,無需粗粒化,僅有動力學的奇異值譜特性就可以定量刻畫因果涌現。然而,這些討論都局限于離散狀態的馬爾可夫鏈系統。本文將討論因果涌現在(1)式所示的線性高斯迭代系統的擴展,并證明兩套框架的等價性。
通過基于奇異值分解的可逆性度量的因果涌現
基于最大化有效信息的因果涌現理論需要求解一個優化問題,從而得到最優的粗粒化策略。因此,我們需要一種更直接的不依賴于粗粒化方案的近似等價的因果涌現定義。這就是基于動力學可逆性概念的因果涌現定義,它可以把求解最優粗粒化方案W的問題,轉化為對動力學進行SVD分解的問題。
由前文中維度平均可逆信息的定義式,我們可以得到它最終值取決于兩個譜,一個是A∑-1AT的譜s1≥…≥sn,另一個是∑-1的譜κ1≥…≥κn,因此,仿照因果涌現的量化式子(前一個式子)我們可以從這兩個譜的分布來定義基于動力學近似可逆性與SVD的因果涌現為(附錄定義)
![]()
其中我們定義有效秩r?為在剔除所有包含小于給定閾值的奇異值,即滿足κi <?< pan> 或si <?< pan> ,的維度后,動力學可逆性得以增強的新系統的維數,這種情況我們也稱為模糊因果涌現。若∑-1AT或∑-1不滿秩,那么?=0時,仍然會出現0\n"},"displayMode":"inline","viewType":"inline"}}">ΔΓα(0)>0的情況,我們將這種情況定義為清晰因果涌現。這就是基于SVD的因果涌現量化方法的兩種形式。
這套框架是合理的,最重要的一個原因是這套新的對因果涌現的定義近似是與Hoel等人【3】的定義的基于有效信息的因果涌現在連續系統在的結果是一致的。基于SVD的因果涌現與基于最大化有效信息得到的因果涌現,呈近似線性關系
![]()
當A滿秩,且A∑-1AT=In即逆向動力學為為標準正態分布時,等號成立。
模型分析
基于這種量化方法,我們僅僅需要知道∑-1與A∑-1}AT的奇異值,并觀察奇異值譜就可以讓因果涌現是否存在一目了然。現在我們就可以回到我們開頭提到的三個模型,對他們的因果涌現進行量化分析。
旋轉模型
例如旋轉模型的動力學,我們可以先在下圖(a)中寫出他的參數矩陣A, ∑,A,∑中黃色覆蓋的模塊代表了例1圖1(a)中旋轉軌跡明顯,噪聲較小的x1,x2維度,而灰色區域覆蓋的模塊代表無明顯變換,只有噪聲影響的x3維度。這樣我們可以通過將所有維度依據其對應的∑-1與A∑-1AT的奇異值從大到小排序,從而繪制出奇異值譜。從(b)中,我們看到∑-1與A∑-1AT的奇異值都在第2和第3個維度之間存在著明顯的數值上的衰減。于是,我們可以在這個位置設定閾值?(水平虛線)并做截斷,從而忽略掉截斷(豎直虛線)右側的接近于零的奇異值以及其對應的維度,而保留剩下的明顯大于零的奇異值以及其對應的維度。
![]()
也就是說從這張圖上,我們只需要觀察奇異值譜上是否有接近或等于零的奇異值,就可以判斷是否存在因果涌現,如果存在,則系統中就發生了因果涌現,否則就沒有發生。而這種觀察到的結果,可以直接用近似可逆性指標進行量化。
從物理意義上分析,若系統的正向或逆向動力學的逆協方差矩陣存在一個或多個為零或近似為零的奇異值,則稱該系統發生了因果涌現,這些等于或接近零的奇異值所對應的奇異向量表征了動力學中冗余的維度,如同前文例1圖1(a)中的x3維度,不僅動力學參數較小而且噪聲很大,其存在顯著降低了系統的整體的近似可逆性。
![]()
進一步講,若通過適當的粗粒化操作消除這些冗余維度,則可實現動力學去冗余化的降維壓縮,壓縮后維度平均可逆性將得到提升,例如圖中的三維動力學粗粒化為下中的二維動力學。
![]()
因此,可基于近似可逆性的最大可能的增長值,即通過理想粗粒化所能達到的單位維度動力學可逆性的最大提升程度,對系統因果涌現的強度進行定量刻畫。
馬爾薩斯增長模型
這一點對于另外兩個模型也同樣適用。
首先導致馬爾薩斯增長動力學不可逆的一個原因,就是系統中的不同維度之間存在相關性,也就是說整個系統的自由度可能遠低于其所占空間的維數。
我們舉了一個最極端的例子,假設一個4維的向量,前兩個維度x1,x2遵循增長率為0.2和0.05的馬爾薩斯增長模型。同時另外兩個維度x3,x4直接復制了前兩個維度的狀態如下圖所示,他們和前兩個維度高度相關,甚至可以視為冗余的維度。
最終生成數據如例2對應的圖2所示,直接用肉眼觀測數據我們如果不仔細觀察也會覺得似乎只有兩條曲線,似乎宏觀的y1,y2就能直接描述動力學的演化。這一切并不單純是我們的錯覺。
![]()
我們嚴格按矩陣論和高斯過程的理論進行分析,該系統我們可以認為是A如下圖(a)所示。若規定正向協方差矩陣為單位矩陣,如圖(b)所示,我們可以明顯感覺反向動力學協方差矩陣只有兩個維度起主要作用,另外兩個維度信息會大打折扣。
![]()
這一點,我們可以用下圖的奇異值譜觀察,我們可以看到橫軸表示逆向動力學協方差矩陣的奇異值s1≥…≥s4, 縱軸表示奇異值大小,我們只能看到兩個較大的逆向動力學奇異值,此時我們規定閾值?=2, 因果涌現可以計算得到0\n"},"displayMode":"inline","viewType":"inline"}}">ΔΓα(?)=0.4195。
![]()
布朗運動
相關性可以通過影響逆想動力學的協方差矩陣,降低動力系統的可逆性,同時正向動力學噪聲本身,也會改變動力學的可逆性大小,如果某個維度噪聲越大,該維度越不可逆。這也給我們研究動力學演化提供了一個新思路:在隨機系統中尋找噪聲小的維度,更能觀察到系統整體的演化規律,第二個案例就能給出展示。
離散布朗運動是離散時間內連續布朗運動的近似,常用于數值模擬和隨機過程建模。方程s1≥…≥s4可以被視為奧恩斯坦-烏倫貝克(OU)過程的離散版本方法。在這個模型中,f(xt)=a0+Axt是影響狀態演化的漂移向量,協方差矩陣∑表示擴散系數,它決定了噪聲的隨機波動的幅度。由此我們可以直接得到對∑-1和AT∑-1A,如圖所示。
![]()
進行SVD分解之后我們可以得到下圖中的奇異值譜之后,規定?=0.6,我們可以得到Δ0\n"},"displayMode":"inline","viewType":"inline"}}">Γα(?)=0.5167,其中有效秩為4。
![]()
基于奇異值分解的粗粒化策略
最終我們可以從動力學的角度看出,因果涌現的產生其實是有兩個關鍵因素,一個就是演化過程中,系統之間不同元素、不同維度之間存在相關性,導致自由度存在冗余。以鳥群為例,下圖(a)中,左側兩只鳥完全獨立不存在相關性,從動力學角度講,若兩只鳥運動速度與隨機性都相同,則不存在涌現;一旦右側兩只鳥之間存在相關性,彼此進入了對方的檢測范圍(橙色圓環),那么此時的自由度就會降低,甚至可以將兩只鳥看成一個整體分析更容易判斷整體的運動趨勢。
另一個就是噪聲在不同維度存在不同的大小,有的維度隨機性很強,難以預測運動趨勢,但是有的維度就確定性很強,隨機性很弱,如同下圖(b)中較大的奇異值κ1代表維度確定性更強,隨機性更弱,該維度可能的變化范圍就更小;κ2代表維度確定性更弱,可能的變動范圍會更大。此時如果重點分析隨機性較小,確定性更強的維度,就能對系統的演化存在更有效的分析。
![]()
我們的粗粒化策略最終其實就是需要實現兩個目的,第一,整合相關性強的維度,降低冗余的維度,尋找真正的自由度;第二刪除噪聲過強的維度,保留更有確定性的部分。我們只需要下面的兩輪SVD法就可以實現。
對于任何高斯迭代系統,我們可以首先在AT∑-1 A和∑-1上執行奇異值分解,以獲得兩個奇異值譜\\cdots>s_n\n"},"displayMode":"inline","viewType":"inline"}}">s1>…>sn和\\cdots>\\kappa_n\n"},"displayMode":"inline","viewType":"inline"}}">κ1>…>κn。其次,我們需要對兩組奇異值譜進行截斷。然而,由于它們對應的奇異向量可能并不都是正交的,它們的子空間可能會重疊或沖突。因此,我們結合兩個奇異向量矩陣并執行第二輪奇異值分解。基于此,我們可以通過降維得到粗粒化矩陣和相應的宏觀動力學。經過兩輪奇異值分解,我們得到最終的粗粒化策略。
我們最終達到的效果就是保留重合的空間,并對存在沖突的空間基于奇異值大小優先保留較大的奇異值。可以通過下圖進行直觀的理解,例如有效秩為2的時候,我們希望把三維動力學降維到二維空間。動力學中的奇異值譜s1=1.2,s2=0.8,s3=0.2和κ1=1,κ2=0.7,κ3=0.3對應的奇異向量u1,u2,u3與v1,v2,v3,u1與v1近乎重合,我們認為不存在明顯的沖突,此時我們的策略可以得到一個居中的向量,盡量同時保留兩個維度對應的奇異值s1與κ1;然而剩下的維度中,存在沖突,我們的方法會優先保留剩余奇異值中最大的s2對應的奇異向量v2,構建向量。將行向量w1與w2拼接后就可以得到粗粒化矩陣W,他可以將三維空間中的動力學投影到兩條紅色向量張成的二維空間當中。
![]()
例如圖1中我們就可以得到將前兩個維度保留,第三個維度舍棄的粗粒化策略。
知道粗粒化策略和其原理之后,我們就可以返回來看看開始的三個案例粗粒化得到的結果。對于旋轉模型,我們之前提到三維動力學粗粒化為二維動力學。因此,可基于近似可逆性的最大可能的增長值,即通過理想粗粒化所能達到的單位維度動力學可逆性的最大提升程度,對系統因果涌現的強度進行定量刻畫。而基于SVD得到的粗粒化矩陣做的就是舍棄第一個維度,并將前兩個維度重新組合,變成二維動力學。
![]()
而馬爾薩斯增長模型由于復制的存在,我們基于奇異值分解的粗粒化策略將x1,x3信息合并,x2,x4信息合并,達到降維并增強可逆性的效果。可見我們的框架一個重要的功能就是可以找到系統中相關的維度,并將其合并。
![]()
而對于布朗運動,基于SVD我們可以計算具體的粗粒化策略,得到下圖中的矩陣W。通過粗粒化策略的求解,我們可以觀察到我們的宏觀態yt=Wxt,其保留了x1,x2,x3,x5四個維度,正向、逆向動力學噪聲都較大的x4,x6,x7,x8被舍棄。這些維度對應的關系如右圖所示,這里1-8節點代表8個維度。(連線代表i節點與j節點之間動力學連接,由矩陣A決定,若0\n"},"displayMode":"inline","viewType":"inline"}}">Aji-Aij>0則會出現一條i指向j的連邊,顏色越接近黑色Aji-Aij越大,反之亦然)。
![]()
我們可以發現,其實我們這個案例,在正向、逆向動力學的協方差矩陣都不是對角陣,即不同維度的可逆性存在差異的情況下,我們會優先保留包含正向或逆向動力學中噪聲的逆協方差矩陣較大的奇異值的維度,這些維度噪聲更小,動力學函數的梯度更大,可逆性更強。保留這些可逆性強的維度,忽略噪聲大可逆性弱的維度,就能讓整個系統具有更強的因果性,因果涌現也會隨之產生。
神經網絡學習下的SIR模型
在NIS+中的SIR模型在這里也可以通過可逆性與SVD分解計算因果涌現并研究其底層產生涌現的機理。現實中的大多數系統都無法獲得精確的動態模型來計算因果涌現的解析解。然而,我們可以通過觀察到的時間序列數據訓練神經網絡來獲得近似動力學。神經網絡模型如下圖所示,我們通過訓練神經網絡,學習到SIR動力學的映射函數與協方差矩陣,并計算近似可逆性與因果涌現。
![]()
我們用神經網絡(NN)在易感-感染-恢復(SIR)模型生成的訓練時間序列數據上的因果涌現現象時,模型有兩個自由度,如下所示
![]()
其中S表示易感態樣本的比例,I表示感染態的比例,R表示恢復態的比例,三者的關系如圖所示。
![]()
我們可以采取和增長模型相同的數據處理方法,x3,x4直接復制了前兩個維度的狀態,得到x=(S,I,S,I),之后我們可以將模型離散化,即
![]()
由此可以通過機器學習得到下圖中的生成數據。數據雖然處于三維空間,但其實只有S和I兩個自由度。
![]()
經過神經網絡訓練后,對得到的正、逆向協方差矩陣求平均值,我們就可以近似估計出系統的兩個協方差矩陣,如下圖所示,可以看出,AT∑-1A(如圖c所示)有兩個較大的奇異值,差距比∑-1(如圖d所示)更大。規定?=5在模型訓練中,當訓練周期為50000時,我們可以得到最終有效秩r?=2,因果涌現的值為Δ0\n"},"displayMode":"inline","viewType":"inline"}}">Γα(?)=0.8685。
![]()
我們可以得到左上圖中的粗粒化策略參數矩陣,粗粒化策略將x1,x3信息合并,x2,x4信息合并,達到降維的效果。這一點與左下方中NIS+【4】的編碼器的梯度相符。同時圖右側我們可以看到隨著協方差矩陣中標準差參數σ增大,基于有效信息與基于可逆性的因果涌現都在σ=0.01時達到峰值,這與NIS+中的結果相符。
![]()
而整個方法也為我們處理一些未知模型或者難以計算的模型如何檢測因果涌現的大小提供了一個有效的途徑,為我們基于數據驅動的因果涌現打下了基礎。
總結與討論
本文提出了基于近似動力學可逆性的因果涌現新框架,適用于高斯信息系統。該方法直接利用正向、逆向動力學逆協方差矩陣的奇異值分解來量化因果涌現,其度量 不依賴于預設的粗粒化策略,具有更高的計算精度與效率。同時,從這兩個矩陣的奇異向量可直接導出最優粗粒化方案:它自動合并強相關維度并剔除噪聲主導維度,從而得到物理意義清晰、可解釋性強的宏觀描述,克服了傳統方法依賴人工設計以最大化有效信息的局限。理論分析進一步揭示了兩個框架之間的內在聯系,并通過隨機參數采樣得到了證實。
本工作的另一創新在于將 SVD 系統性地應用于隨機動力學分析。傳統研究多聚焦于確定性系統或僅將噪聲視為擾動,而我們將 SVD 作用于連續馬爾可夫過程,同時涵蓋確定性映射 與隨機協方差,并以逆協方差矩陣作為信息載體,其奇異值揭示了系統內嵌的可逆信息。這一視角統一處理了確定性、隨機性與可逆性,能夠辨識驅動復雜系統演化的關鍵自由度,為理解各類實際系統的動力學本質提供了新途徑。
這篇工作在最后提出了神經網絡學習下的因果涌現,其實我們可以認為是機器本身作為觀察者,在不可逆的系統中,尋找可逆性。智能體在本質上不可逆的宏觀世界中,通過學習“粗粒化”——即忽略細節、進行歸類與壓縮——來構建一個近似可逆的動力學模型。這看似矛盾:壓縮本身意味著信息損失,本應引入不可逆性;正如玻爾茲曼所指出的,觀測者因信息受限而在宏觀層面看到熵增與不可逆。然而,智能體所做的恰恰是在這一“不可逆的宏觀廢墟”上有意識地重建秩序與可逆性:它并非復原微觀細節,而是通過有選擇的忽略,提煉出那些能夠保持預測穩定性與因果解釋力的宏觀模式,從而在信息簡化后的表征中重新構造出近似可逆的動力學規律。這揭示了一種深刻的適應性智慧:智能體不是被動承受不可逆性,而是主動塑造一種簡化的、卻更具操作性與可理解性的“可逆表象”,并借此在復雜世界中有效認知與行動。
盡管取得進展,當前框架仍面臨若干挑戰:其一,模型目前局限于線性 GIS,非線性情況需局部線性化,但梯度病態可能導致框架失效;其二,連續時間情形缺乏客觀的 CE 量化公式,離散化的時間步長對結果影響顯著;其三,當系統方程未知時,依賴神經網絡估計動力學會引入數據依賴性與參數誤差。未來工作將致力于優化現有框架,并借助機器學習將其應用于維切克、倉本等復雜模型以及氣象、腦電等真實數據,以探索 CE 與臨界狀態的關系,并在實際系統中驗證其洞察力。
參考文獻
【1】Liu K, Pan L, Wang Z, et al. SVD-based Causal Emergence for Gaussian Iterative Systems[J]. arXiv preprint arXiv:2502.08261, 2025.
【2】Zhang J, Tao R, Leong K H, et al. Dynamical reversibility and a new theory of causal emergence based on SVD[J]. npj Complexity, 2025, 2(1): 3.
【3】Hoel E P, Albantakis L, Tononi G. Quantifying causal emergence shows that macro can beat micro[J]. Proceedings of the National Academy of Sciences, 2013, 110(49): 19790-19795.
【4】Yang M, Wang Z, Liu K, et al. Finding emergence in data by maximizing effective information[J]. National Science Review, 2025, 12(1): nwae279.
因果涌現第七季——從理論到應用
在神經系統中意識的生成、城市交通的擁堵演化、全球產業系統的協同與失穩之中,始終潛藏著一條貫穿微觀與宏觀的因果脈絡:個體行為本身或許簡單,卻能在尺度躍遷中孕育出高度組織化、難以還原的整體結構。復雜現象并非微觀規則的線性疊加,而是源于多尺度動力學作用下逐步形成的因果組織。正是在這一背景下,因果涌現理論被提出,并在因果涌現 2.0、工程化涌現以及多尺度因果抽象等工作中推進,逐漸發展出一套融合動力學分析、信息論度量以及譜方法與人工智能工具的研究框架,從而將研究重心從“復雜性本身”轉向“因果結構如何出現、如何被度量并在現實系統中發揮作用”。
為系統梳理因果涌現領域的最新進展,北京師范大學系統科學學院教授、集智俱樂部創始人張江老師領銜發起,組織對該主題感興趣的研究者與探索者共同研讀前沿文獻、交流研究思路。讀書會將于2026年2月22日起每周日上午(創建讀書會暫定時間為10:00-22:00)線上開展,持續約10周,包含主講分享與討論交流,并提供會后視頻回放,誠邀相關領域研究者及跨學科興趣者參與。
![]()
詳情請見:
線性代數:一名合格科研人的筑基課
在科研世界中,無論你研究的是人工智能、生物信息、網絡科學,還是物理與工程,幾乎所有復雜系統的建模與推理都指向同一種底層語言——線性代數。它不僅是計算公式的集合,更是一名科研人理解“結構”、刻畫“變換”、判斷“穩定性”、提取“信息”的基本思維框架。本課程以系統科學的視角重新解構線性代數,帶你越過技巧、直達本質,在跨學科的真實問題中建立起科研必備的數學基石。集智學園聯合清華大學數學博士諸葛昌靖老師推出「」,并邀請武漢大學數學與統計學院周進教授于1月20日、1月27日就特征值與特征向量在復雜網絡中的應用做特別加餐分享。課程已于12月20日開啟,歡迎加入社群交流。
![]()
詳情請見:
1.
2.
3.
5.
6.
7.
8.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.