![]()
導語
當用網(wǎng)絡描述一個復雜系統(tǒng)時,僅憑兩兩連接(pairwise interactions)或許遠遠不夠。學術(shù)會議上的多人交談、藥物配方中的多種成分、論文的多個合著者,這些場景本質(zhì)上都涉及高階交互(higher-order interactions)。然而,記錄高階交互的成本極高。究竟何時必須使用高階網(wǎng)絡,何時又可以安全地將其簡化為普通的成對網(wǎng)絡?2026年1月15日發(fā)表于《Nature Communications》的一項研究給出了新的答案。該研究借鑒量子統(tǒng)計物理與信息論,提出了一套量化框架,試圖回答:高階網(wǎng)絡能否在保留核心功能信息的前提下,被“壓縮”回低階結(jié)構(gòu)。
關(guān)鍵詞:高階網(wǎng)絡,可約性(reducibility),密度矩陣(density matrix),擴散動力學,信息論,模型壓縮(model compression)
王璇丨作者
趙思怡丨審校
![]()
論文題目:Reducibility of higher-order networks from dynamics 論文鏈接:https://www.nature.com/articles/s41467-025-68273-4 發(fā)表時間:2026年1月15日 論文來源:Nature Communications
當網(wǎng)絡不再只是“連線”
傳統(tǒng)成對網(wǎng)絡以節(jié)點代表個體、邊代表關(guān)系,在社交網(wǎng)絡分析和腦科學等領(lǐng)域功不可沒。但現(xiàn)實遠比這復雜,一場代謝反應往往是多種底物與產(chǎn)物同時參與的“化學反應團”;學術(shù)會議中,人們以小團體形式交談,而非僅一對一對話。這些場景的核心在于,交互本質(zhì)是“群體的”,而非“成對的”。
為捕捉這種群體交互,研究者引入高階網(wǎng)絡,常見形式包括超圖(hypergraph)和單純復形(simplicial complex)。高階網(wǎng)絡雖描述能力強大,但代價也極其高昂:存儲需新格式,分析需新工具,計算復雜度更隨階數(shù)指數(shù)級攀升。這引出研究的核心矛盾:高階網(wǎng)絡的“高保真”描述,究竟何時必要且不可替代?
從結(jié)構(gòu)到功能:
用擴散動力學尋找最優(yōu)“壓縮率”
判斷一個網(wǎng)絡是否“可約”,不能只看結(jié)構(gòu),更要看在網(wǎng)絡上發(fā)生的動態(tài)過程,從功能視角評判結(jié)構(gòu)的必要性。研究者選擇擴散(diffusion)作為探測工具:想象在網(wǎng)絡節(jié)點上釋放信息,它會沿著連接流動。短時間內(nèi),信息只能流到鄰近節(jié)點,探測局部結(jié)構(gòu)。長時間內(nèi),信息遍布全網(wǎng),反映全局特征。這個時間參數(shù)τ(擴散時間)就像一個可調(diào)的“放大鏡”。
![]()
圖1 高階網(wǎng)絡的功能可約性。
作者借用量子物理中的密度矩陣概念,將網(wǎng)絡狀態(tài)編碼為一個矩陣。他們進一步將其推廣到高階網(wǎng)絡,使用多階拉普拉斯矩陣(multiorder Laplacian)對1到D階超邊進行加權(quán)求和,從而定義了描述高階網(wǎng)絡在擴散時間τ下狀態(tài)的高階密度矩陣。這個矩陣成為評價模型的數(shù)據(jù)本身。
對于一個最高階數(shù)的超圖,如果只保留到d階的超邊,簡化版模型能在多大程度上再現(xiàn)原始系統(tǒng)的擴散過程?研究者構(gòu)建了一個代價函數(shù)(cost function)來量化:代價 = 信息損失 + 模型復雜度。信息損失用KL散度衡量,簡化模型描述原始數(shù)據(jù)時丟失了多少信息。模型復雜度則用簡化模型與“孤立節(jié)點系統(tǒng)”的熵之差定義:結(jié)構(gòu)越有序、越復雜,熵越低,復雜度越高。兩者之和呈現(xiàn)先降后升的U形曲線,曲線最低點對應的d就是最優(yōu)階數(shù)。
![]()
圖2 成本函數(shù),基于Kullback–Leibler散度的信息損失與模型復雜度之和。
比較不同階數(shù)模型時面臨一個關(guān)鍵技術(shù)問題:擴散時間τ的尺度不統(tǒng)一。一個3階超圖和只含1、2階的簡化版,相同τ值意義完全不同。為此,作者推導出時間標度變換。考慮簡化模型時,必須用更長的擴散時間去探測,才能與原始模型公平比較。這一變換保證了比較的公平性。
從理論到現(xiàn)實:
超環(huán)、隨機網(wǎng)絡與實證數(shù)據(jù)
為驗證框架有效性,團隊從理論模型一路走向真實數(shù)據(jù)。他們首先分析超環(huán),發(fā)現(xiàn)極短擴散時間下,超環(huán)不可約,因信息流動依賴局部高階結(jié)構(gòu)。中等及較長時間下,它變得可約,因全局連通性主導。這表明可約性本身依賴于觀察的時間尺度。隨后轉(zhuǎn)向兩種隨機網(wǎng)絡:隨機超圖中,各階超邊隨機獨立生成,系統(tǒng)幾乎不可約,而隨機單純復形因包含性約束產(chǎn)生結(jié)構(gòu)冗余,變得可約。
團隊進一步分析60個真實高階網(wǎng)絡數(shù)據(jù)集,涵蓋合著、面對面接觸、藥物成分、代謝、政治提案、戲劇角色同臺等。短時間尺度下,不同系統(tǒng)可約性差異巨大。長時間尺度下,幾乎所有系統(tǒng)都不可約,再次印證了高階交互在宏觀尺度上無法忽視。
![]()
圖3 超環(huán)的解析可約性。
什么決定了可約性?研究者聚焦可約性較高的“面對面接觸”數(shù)據(jù)集,設計三套隨機化策略:配置模型(Configuration Model),節(jié)點交換(Node Swap)和完全洗牌(Shuffling)。結(jié)果發(fā)現(xiàn),策略1和2雖極大破壞嵌套性,卻保留了可約性,只有策略3破壞度異質(zhì)性后,才徹底摧毀可約性。在這些社交網(wǎng)絡中,決定可約性的核心并非高階與低階的包含關(guān)系,而是節(jié)點的度分布及其異質(zhì)性:只要“社交活躍度”分布被保留,擴散功能就依然“可約”。
邁向更精簡的復雜系統(tǒng)模型
當面對日益復雜的數(shù)據(jù)世界,知道何時應該簡化,或許比知道何時應該復雜化更具智慧。并非所有系統(tǒng)都天生需要高階模型,在面對面接觸這類場景中,成對交互或許就能抓住問題的核心。而在學術(shù)合作、生化反應中,高階交互則是不可約簡的硬核信息。這項工作成功地將統(tǒng)計物理、量子信息的概念引入網(wǎng)絡科學,為解決網(wǎng)絡模型的維度災難提供了一個嶄新的視角。未來的研究可以沿著這個方向,探索更普適的動力學、更嚴謹?shù)呢惾~斯模型選擇框架,以及如何將這種可約性分析應用于更多的生物和社會系統(tǒng),例如理解大腦的連接組究竟在多大程度上依賴于高階的神經(jīng)元協(xié)同放電。
高階網(wǎng)絡社區(qū)
隨著對現(xiàn)實世界探索的不斷深入,人們發(fā)現(xiàn)在許多真實的復雜系統(tǒng)中,組成系統(tǒng)的個體之間不僅存在二元交互關(guān)系,也廣泛存在多個體同時(或以特定順序)進行交互,即高階交互現(xiàn)象。為此,研究人員分別發(fā)展出了基于超圖、單純復形、依賴關(guān)系等的網(wǎng)絡高階表示模型,為復雜網(wǎng)絡分析和研究提供了新的思路。
由電子科技大學呂琳媛老師、任曉龍老師及中國地質(zhì)大學(北京)管青老師在集智俱樂部聯(lián)合發(fā)起了【 】。讀書會圍繞高階交互網(wǎng)絡的基本概念、模型、方法與應用等研究進行研討,按照「基礎(chǔ)理論」+「深入理論」+「案例研討」的模式展開。讀書會第一季已經(jīng)圓滿結(jié)束,第二季正在籌備中。現(xiàn)在報名加入可以解鎖第一季全部錄播視頻并加入社群交流。
詳情請見:
1.
2.
3.
4.
5.
6.
7.
8.
9.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.