![]()
導語
生命系統為何能在多變環境中保持穩定又不失靈活?本文從信息論與因果動力學的視角出發,將生命與人工系統統一為“系統—環境耦合”的信息處理過程。北師大系統科學學院楊明哲等人于2025年9月在《Digital Technologies Research and Applications》發表論文《Quantifying System-Environment Synergistic Information by Effective Information Decomposition》,提出基于有效信息分解的全新指標——活性(flexibility),用于定量刻畫系統在不同環境下靈活調整自身動力學的能力。研究進一步在元胞自動機、基因調控網絡與人工布爾網絡中驗證:真正具備適應性的系統,往往依賴系統與環境之間的協同信息,并工作在“混沌邊緣”的動力學區域。
為系統梳理因果涌現領域的最新進展,北京師范大學系統科學學院教授、集智俱樂部創始人張江老師領銜發起,組織對該主題感興趣的研究者與探索者共同研讀前沿文獻、交流研究思路。讀書會將于2026年2月22日起每周日上午(創建讀書會暫定時間為10:00-22:00)線上開展,持續約10周,包含主講分享與討論交流,并提供會后視頻回放,誠邀相關領域研究者及跨學科興趣者參與。
關鍵詞:信息論、復雜系統、系統—環境耦合、有效信息、協同信息、元胞自動機
楊明哲丨作者
張江丨審校
![]()
論文題目:Quantifying System?Environment Synergistic Information by Effective Information Decomposition 論文鏈接:https://ojs.ukscip.com/index.php/dtra/article/view/1492 發表時間:2025年9月29日 論文來源:Digital Technologies Research and Applications
作者簡介:
生命一直是這個世界中很令人感到驚奇的系統。我們可以看到,各種生物為了適應環境演化出非常多樣的策略和手段。刺猬發展出了帶有外刺的物理保護,變色龍則有自己的擬態保護色。這樣的屬性,我們也希望人工系統能夠具備。比如無人駕駛的汽車或機器人能根據環境的變化靈活切換自己的運動模式。如果能做到這一點,我們便認為這樣的系統好像活了一般,是一個可以自發趨利避害的“生命體”。事實上,無論是先進的人工系統,還是我們在茫茫宇宙中試圖發現的地外生命,都很可能不再是有機大分子構成的系統,卻同時擁有生命才有的外在特征,此時我們要如何度量系統適應環境的能力?
對此,信息論是一個不錯的工具。任何一個生命作為系統,其內部單元之間,以及環境與系統單元之間,都會有信息傳遞的過程。而信道容量的大小,也與系統能夠采取的動力學模式或策略有著直接的關系,如下圖所示[1,2]。其中橫軸表示互信息大小,縱軸表示系統的表現或策略。可以看出,互信息越大,系統的能力也就越強。互信息可以看作是系統能力表現的上界。這種描述方式可以繞過復雜的生物學細節,直接刻畫一個系統屬性或能力的表現。這使得學者們越來越青睞于使用信息論的視角來刻畫與研究生命系統[1,2]。
![]()
圣塔菲研究所所長、進化生物學家David Krakauer曾提出過個體信息論(The information theory of individuality)來研究一個系統在多大程度上可以被看作是一個生命個體,即個體性(individuality)。他先在一個馬爾可夫過程上描述系統自身的變量(Xt)與環境變量(Et),如下圖所示,圖中空心圓和實心圓分別表示各個變量的不同狀態,隨著時間它們會因為彼此交互的動力學而產生變化。這樣,我們便可以在一個動力學過程中量化系統自身的信息傳遞,以及環境對系統的信息傳遞。通過組合這些信息量,Krakauer定義出來了一系列的個體性,比如針對大型生物的有機個體性和針對細菌菌群的群落個體性等等。
![]()
這看起來是一個很簡便的計算,但它沒有直接揭示生命系統的動力學性質。其實,生命主體與環境的交互過程可以分為不同的動力學來看待,而許多生命主體在不同的時空坐標上都能維持穩定的生命特征,更多應當歸因于動力學性質,而不是初始條件。
我們可以用一個動力學刻畫環境對系統的驅動或影響,決定的是環境對系統的輸入信息,另一個動力學則刻畫系統內在的調整和變化,決定的是其自身傳遞的信息。還有第三個動力學,則是系統和環境耦合在一起對系統影響的動力學。在信息分解上,系統與環境耦合變量對系統未來狀態的影響沒辦法拆成前兩個動力學的簡單加和,因為會多出來一部分是系統與環境對系統未來狀態產生的協同信息,這也正是個體信息論中沒辦法分離出來計算的信息。
一般的物理過程,包括生命的變化,都可以看作是一個馬爾可夫過程,所以我們可以用馬爾可夫概率轉移矩陣(Transition Probability Matrix,TPM)來描述諸多動力學過程。為了讓信息指標直接刻畫動力學本身的性質,我們借鑒整合信息論與因果涌現理論[4],把原本的分析對象聯合互信息變成有效信息(Effective information,EI)。EI的計算公式如下所示,其中P表示TPM,X和Y分別對應轉移矩陣的輸入和輸出,do(X~U)表示將輸入干預為均勻分布。
這里干預操作的好處在于去除了初始條件的影響,從而使其只反映動力學性質的區別。接下來,我們對整體的EI做分解,便可以定義出活性(flexibility),即系統與環境耦合時,靈活響應環境能力的大小。
如下圖所示,左圖是空間上的因果圖,右圖是在時間上展開的因果圖。對應的是系統與環境變量對系統影響的概率轉移矩陣,分別是系統自身和環境單獨對系統影響的概率轉移矩陣。表示個體驅動信息,表示外部驅動信息。便是我們定義的活性,事實上,我們可以證明它是非負的并且刻畫的恰好是系統與環境耦合后對系統自身傳遞的協同信息。該工作便是集智科學研究中心2025年9月發表在《Digital Technologies Research and Applications》上的《Quantifying System‐Environment Synergistic Information by Effective Information Decomposition》[5]。
![]()
為什么這里算出來的就是系統的活性?實際上,我們可以在數學上把該指標拆成兩部分,即擴展性和內向性:
![]()
其中|ΩX|表示變量X狀態的數量,H(.)表示計算某概率分布的香農熵,Px,e表示整體的TPM對應系統變量和環境變量分別取值為x,e時對應的條件概率分布。
在實驗中,擴展性高往往意味著系統動力學在不同環境下有很大的差異,而內向性高則對應著系統不管在什么樣的環境下,傳遞自身的信息總是很高,也就是噪音低。所以綜合來說,所謂活性高的系統,便是在不同環境下動力學都盡可能存在差異,而且每個動力學都表現出低噪聲。這里涉及的術語較多,下面表格給出了各個概念的物理解釋或對應的例子。
術語摘要
術語
動力學描述
物理解釋或示例
活性 (Flexibility)
TPM(轉移概率矩陣)在不同環境間存在差異,并表現出低噪聲。
靈活適應多種環境并總保持信道容量最大化。
擴展性 (Expansiveness)
TPM 在不同環境間存在差異。
水蚤在不同環境中切換繁殖模式。
內向性 (Introversion)
TPM 表現出低噪聲。
刺猬的刺殼為抵御大多數威脅提供了物理保護。
個體驅動信息 (Individual Driving Information)
系統的狀態僅取決于其上一時間步的狀態。
大多數無機物質保持穩定的結構和狀態。
外部驅動信息 (External Driving Information)
系統的狀態僅取決于環境在上一時間步的狀態。
大多數蛋白質在高溫環境中會失去活性。
定量框架有了,我們要如何在實驗上驗證這些指標與真實物理含義的聯系呢?早在上個世紀八九十年代,一批圣塔菲研究所的科學家就為我們搭出了實驗場,讓我們可以在計算機上就驗證生命系統的性質,那便是人工生命。簡單的局部規則(周圍兩個鄰居加自身狀態便決定中間鄰居下一時刻的狀態),就能讓元胞自動機展現出紛繁復雜的宏觀現象。Langton和Wolfram等人的研究 [6],讓我們發現復雜類型的元胞自動機擁有最大信息處理能力,能夠完成各種外界任務,就像真實的生命系統一樣。這樣的元胞自動機在動力學上正處于混沌邊緣的地帶。下圖展示了4種初等元胞自動機,分別是固定型(左上)、周期型(右上)、混沌型(左下)以及復雜型(右下)。
![]()
圣塔菲研究所學者Melanie Mitchell發現 [7],對于一維二值的初等元胞自動機,Langton參數為0.5左右的元胞自動機具有最佳的任務表現。這里的Langton參數刻畫的是規則表中下一時刻細胞平均存活的比例。通過對所有256個初等元胞自動機的活性的計算,如下圖所示,我們發現活性與Wolfram的4種類型分類的復雜度呈正相關(a),而且就在Langton參數為0.5左右活性指標最高(b)。相比于傳統的互信息對混沌邊緣的識別,活性指標具有更小的方差(c)。而且,如(d)所示,活性指標與規則表種類一一對應,即它只依賴于動力學,而不依賴于初始條件。
![]()
與元胞自動機相類似,考夫曼等人 [6]也開發了隨機布爾網絡來模擬真實的基因調控網絡。顧名思義,它是指每個節點可以取布爾的二值,分別對應基因表達的沉默和激活。而“隨機”是指節點構成的網絡可以是一個隨機網絡。這正是個體信息論中Krakauer所進行實驗的對象。在新工作中,我們在真實的基因調控網絡的數據上計算活性指標。數據[8]橫跨單細胞生物、動物、植物等多個物種的不同的功能基因調控網絡。我們把3個節點或4個節點的網絡模塊分別看成是系統,而能夠影響該模塊的其他基因看成環境。實驗發現,平均來說,循環反饋回路活性最高(a),哪怕是在4節點的模塊中它也是活性較高的類型(b)。這樣的構造在生物學中往往與生物周期節律、動力學補償等現象相關。圖(c、d)則對比展示了活性高的模塊和活性低的模塊在面對不同環境切換的沖擊下的狀態演化的區別。可以看出,活性較高的系統具有更多穩態的可能性。
![]()
接下來我們拿一個人造的布爾網絡來舉例。其結構如下圖所示,其中有兩個參數,一個參數w控制系統ABC內部作用與兩個環境變量對系統影響的比例,另一個參數溫度T則對應整體動力學噪音的強度,T越大代表噪音越大。下圖中的熱圖(a)展現了活性指標隨兩個參數的變化。當內部作用與外部影響相當時,活性指標基本上最高;同時噪音越低,活性越高,這也符合直覺。而有意思的是,活性與噪音大小并不總是負相關的關系。有時候,如果噪音的增加會使得系統在不同環境下的動力學有了更多的多樣性,那么此時噪音的增加對于活性來說反倒是件“好事”。
![]()
![]()
前面的實驗建立在動力學已知的情況下,如果我們只有數據,能否用機器學習學習到動力學之后再應用活性指標?上圖(b)中虛線便展示了對于機器學習動力學的活性指標變化,可以看出與真實值相近,可見指標計算對擬合的誤差不敏感。此時能看到隨溫度T增加,活性有一個峰值,這其實就代表了適當的噪音(動力學內在的噪音)可以增強系統適應環境的能力。在生物學中,噪音對于誘導生物體構成產生生物鐘節律的振蕩至關重要。
最后我們總結一下該研究所涉及的領域和脈絡。可以從問題和方法兩個角度出發:在問題上,我們早已對生命系統獨有的動力學特征有深入的研究,包括自組織理論、人工生命等等。而當我們想要對各種形式的系統都能度量生命系統適應環境的能力時,便需要信息論來作為工具。我們不只要借用熵、互信息等基本的信息論概念,還要在因果機制的層面上,關注多元變量間的信息傳遞和分解。可以說,活性指標的提出,離不開諸多經典理論的指導。而在未來,這種獨特的研究方式必將在人工生命、地外生命等研究領域里大放異彩。
![]()
參考文獻
[1] Bartlett, S., Eckford, A. W., Egbert, M., Lingam, M., Kolchinsky, A., Frank, A., & Ghoshal, G. (2025). The Physics of Life: Exploring Information as a Distinctive Feature of Living Systems (arXiv:2501.08683). arXiv.
[2] Tkacˇik, G., & Bialek, W. (2016). Information Processing in Living Systems.
[3] D. Krakauer, N. Bertschinger, E. Olbrich, J. C. Flack, and N. Ay, The information theory of individuality, Theory in Biosciences 139, 209 (2020).
[4] Yuan, B., Zhang, J., Lyu, A., Wu, J., Wang, Z., Yang, M., Liu, K., Mou, M., & Cui, P. (2024). Emergence and Causality in Complex Systems: A Survey of Causal Emergence and Related Quantitative Studies. Entropy, 26(2), 108. https://doi.org/10.3390/e26020108
[5] Yang, M., Pan, L., & Zhang, J. (2025). Quantifying System?Environment Synergistic Information by Effective Information Decomposition. Digital Technologies Research and Applications, 4(3), 22–34. https://doi.org/10.54963/dtra.v4i3.1492
[6] Langton, C. G. (1990). Computation at the edge of chaos: Phase transitions and emergent computation. Physica D: Nonlinear Phenomena, 42(1–3), 12–37.
[7] Mitchell, M., Crutchfield, J. P., & Das, R. (1997). Evolving cellular automata to perform computations. In T. Bck, D. B. Fogel, & Z. Michalewicz (Eds.), Handbook of Evolutionary Computation. IOP Publishing Ltd.
[8] Kadelka, C., Butrie, T.-M., Hilton, E., Kinseth, J., Schmidt, A., & Serdarevic, H. (2024). A meta-analysis of Boolean network models reveals design principles of gene regulatory networks. Science Advances, 10(2), eadj0822. https://doi.org/10.1126/sciadv.adj0822
因果涌現第七季——從理論到應用
在神經系統中意識的生成、城市交通的擁堵演化、全球產業系統的協同與失穩之中,始終潛藏著一條貫穿微觀與宏觀的因果脈絡:個體行為本身或許簡單,卻能在尺度躍遷中孕育出高度組織化、難以還原的整體結構。復雜現象并非微觀規則的線性疊加,而是源于多尺度動力學作用下逐步形成的因果組織。正是在這一背景下,因果涌現理論被提出,并在因果涌現 2.0、工程化涌現以及多尺度因果抽象等工作中推進,逐漸發展出一套融合動力學分析、信息論度量以及譜方法與人工智能工具的研究框架,從而將研究重心從“復雜性本身”轉向“因果結構如何出現、如何被度量并在現實系統中發揮作用”。
為系統梳理因果涌現領域的最新進展,北京師范大學系統科學學院教授、集智俱樂部創始人張江老師領銜發起,組織對該主題感興趣的研究者與探索者共同研讀前沿文獻、交流研究思路。讀書會將于2026年2月22日起每周日上午(創建讀書會暫定時間為10:00-22:00)線上開展,持續約10周,包含主講分享與討論交流,并提供會后視頻回放,誠邀相關領域研究者及跨學科興趣者參與。
![]()
詳情請見:
1.
2.
3.
4.
5.
6.
7.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.