![]()
導(dǎo)語
網(wǎng)絡(luò)動(dòng)力學(xué)是分析理解高維復(fù)雜系統(tǒng)特性和行為的基礎(chǔ)。盡管許多領(lǐng)域積累了大量的觀測數(shù)據(jù),但只有少數(shù)具備清晰原理的數(shù)學(xué)模型。
近日,清華大學(xué)電子工程系李勇教授團(tuán)隊(duì)提出一種神經(jīng)符號(hào)回歸的方法,能夠從數(shù)據(jù)中自動(dòng)推導(dǎo)公式。該方法減少了在高維網(wǎng)絡(luò)中的搜索,使其等價(jià)為一維系統(tǒng),并且使用預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)來指導(dǎo)正確的公式發(fā)現(xiàn)。在十個(gè)基準(zhǔn)系統(tǒng)中,他準(zhǔn)確恢復(fù)了底層動(dòng)力學(xué)的形式和參數(shù)。在兩個(gè)基于實(shí)證數(shù)據(jù)的自然系統(tǒng)中(基因調(diào)控和微生物群落),它修正了現(xiàn)有模型。預(yù)測誤差分別降低了 59.98% 和 55.94%。對(duì)于不同尺度下人類流動(dòng)網(wǎng)絡(luò)的流行病傳播中,該方法發(fā)現(xiàn)了跨尺度的節(jié)點(diǎn)相關(guān)性呈現(xiàn)相同的冪律分布,并且揭示了國家間干預(yù)效果的差異。這一成果展現(xiàn)了機(jī)器驅(qū)動(dòng)的網(wǎng)絡(luò)動(dòng)力學(xué)發(fā)現(xiàn)如何理解并推動(dòng)復(fù)雜系統(tǒng)科學(xué)的發(fā)展。
關(guān)鍵詞:復(fù)雜系統(tǒng)(Complex system),網(wǎng)絡(luò)動(dòng)力學(xué)(Network dynamics),神經(jīng)符號(hào)回歸(Neural symbolic regression),神經(jīng)網(wǎng)絡(luò)(Neural network)
周曉俊丨作者
趙思怡丨審校
![]()
論文題目:Discovering network dynamics with neural symbolic regression 論文鏈接:https://www.nature.com/articles/s43588-025-00893-8 發(fā)表時(shí)間:2025年10月24日 論文來源:Nature Computational Science
復(fù)雜系統(tǒng)的挑戰(zhàn)
復(fù)雜系統(tǒng)的迷人之處在于:個(gè)體簡單,整體復(fù)雜。從神經(jīng)網(wǎng)絡(luò)到生態(tài)系統(tǒng),從基因調(diào)控到社交傳播,局部相互作用能產(chǎn)生意想不到的全局模式。而理解這些模式,關(guān)鍵在于找到描述系統(tǒng)演化的動(dòng)力學(xué)方程。
過去,這類模型往往依賴人類專家的直覺與經(jīng)驗(yàn)。例如,生物學(xué)家用 Lotka–Volterra 方程解釋物種共存,物理學(xué)家用 Kuramoto 模型刻畫振蕩同步。然而,大多數(shù)系統(tǒng)并沒有清晰的“第一性原理”。面對(duì)浩如煙海的數(shù)據(jù),人類能寫出的方程卻寥寥無幾。
對(duì)于這個(gè)問題,最近清華大學(xué)團(tuán)隊(duì)提出了一種名為ND2(Neural Discovery of Network Dynamics)的方法,利用神經(jīng)網(wǎng)絡(luò)與符號(hào)搜索結(jié)合,從觀測數(shù)據(jù)中自動(dòng)“寫出”網(wǎng)絡(luò)動(dòng)力學(xué)公式。簡單來說,這是一臺(tái)能從混亂數(shù)據(jù)中自己發(fā)現(xiàn)自然規(guī)律的“機(jī)器科學(xué)家”。
![]()
圖1. 方法流程示意圖。實(shí)例為236個(gè)節(jié)點(diǎn)和320條無向邊的北歐電網(wǎng),ND2 根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)和節(jié)點(diǎn)活動(dòng),最后輸出的是經(jīng)典的 Kuramoto dynamics。
ND2:讓高維網(wǎng)絡(luò)“變簡單”的巧思
符號(hào)回歸(symbolic regression)旨在找到最能擬合數(shù)據(jù)的數(shù)學(xué)表達(dá)式。它像在數(shù)學(xué)符號(hào)的叢林中搜尋規(guī)律,組合+, ×, sin等運(yùn)算符,最終得到“隱藏公式”。然而,在高維網(wǎng)絡(luò)中,這種搜索幾乎不可能完成——因?yàn)樽兞亢瓦B邊太多,搜索空間會(huì)指數(shù)爆炸。作者提出 ND2 架構(gòu),將傳統(tǒng)的符號(hào)回歸與神經(jīng)網(wǎng)絡(luò)結(jié)合,讓搜索更聰明、更高效。
第一,引入網(wǎng)絡(luò)動(dòng)力學(xué)算子(network dynamical operators)。這三種算子——源算子φs、目標(biāo)算子φt和聚合算子ρ——受圖神經(jīng)網(wǎng)絡(luò)(GNN)信息傳遞思想的啟發(fā),將復(fù)雜的節(jié)點(diǎn)-邊關(guān)系轉(zhuǎn)化為可操作的數(shù)學(xué)結(jié)構(gòu)。借助它們,研究者把原本隨網(wǎng)絡(luò)規(guī)模指數(shù)增長的搜索空間壓縮成與維度無關(guān)的一維問題。
![]()
圖2. 網(wǎng)絡(luò)動(dòng)力學(xué)算子壓縮搜索空間,b. 網(wǎng)絡(luò)動(dòng)力學(xué)算子。c. 搜索空間壓縮的原理。d. 三節(jié)點(diǎn)網(wǎng)絡(luò)示例
第二, 提出NDformer的神經(jīng)網(wǎng)絡(luò),它結(jié)合了 GNN 與 Transformer 結(jié)構(gòu)。研究者在上百萬個(gè)隨機(jī)生成的動(dòng)力學(xué)系統(tǒng)上對(duì)其預(yù)訓(xùn)練,讓它學(xué)會(huì)“預(yù)測下一個(gè)符號(hào)”,即預(yù)測公式的生成方向。之后,NDformer就像經(jīng)驗(yàn)豐富的導(dǎo)航員,引導(dǎo)蒙特卡洛樹搜索(Monte Carlo Tree Search, MCTS)在公式空間中高效探索,大幅加快搜索速度——實(shí)驗(yàn)表明加速達(dá)三數(shù)量級(jí)。
![]()
圖3. 搜索算法流程。系統(tǒng)從網(wǎng)絡(luò)結(jié)構(gòu)和節(jié)點(diǎn)活動(dòng)中提取信息,在 NDformer 的引導(dǎo)下通過蒙特卡洛樹搜索(MCTS)生成并評(píng)估候選公式,最終選出最優(yōu)的動(dòng)力學(xué)方程。
模擬驗(yàn)證:
十個(gè)模擬系統(tǒng)網(wǎng)絡(luò)動(dòng)力學(xué)的高效復(fù)原
作者首先在十類經(jīng)典動(dòng)力學(xué)系統(tǒng)上測試 ND2,包括 Kuramoto、R?ssler oscillator、FitzHugh–Nagumo 神經(jīng)模型、Wilson–Cowan 腦動(dòng)力學(xué)模型、基因調(diào)控與種群演化模型等。結(jié)果顯示,ND2不僅能準(zhǔn)確恢復(fù)出所有真實(shí)公式的形式和參數(shù),還能再現(xiàn)系統(tǒng)的時(shí)間演化軌跡。相比其他方法(如SINDy稀疏識(shí)別和PIGN網(wǎng)絡(luò)推理),ND2在準(zhǔn)確度與速度上都全面領(lǐng)先。
![]()
圖4. 使用 ND2 在十個(gè)模擬系統(tǒng)上復(fù)原動(dòng)力學(xué)的實(shí)驗(yàn),其準(zhǔn)確度和速度均顯著優(yōu)于對(duì)比方法
更令人驚訝的是,它能在觀測數(shù)據(jù)存在顯著噪聲、網(wǎng)絡(luò)結(jié)構(gòu)部分缺失甚至完全未知時(shí)仍然成功恢復(fù)規(guī)律。這表明,ND2不僅是“擬合數(shù)據(jù)”,而是捕捉了系統(tǒng)背后的生成機(jī)制。
自然系統(tǒng):修正經(jīng)典模型中的網(wǎng)絡(luò)動(dòng)力學(xué)
當(dāng)ND2被用于真實(shí)生物系統(tǒng)時(shí),它展示了比傳統(tǒng)人類模型更精確的解釋力。在酵母細(xì)胞周期的基因調(diào)控網(wǎng)絡(luò)中,經(jīng)典的 Hill 方程假設(shè)基因間相互作用是兩兩相加的。然而ND2發(fā)現(xiàn)了新的公式形式——相互作用項(xiàng)不是獨(dú)立求和,而是以鄰居基因總體表達(dá)量為輸入的邏輯函數(shù)(logistic function)。這意味著基因的調(diào)控存在“更高階的間接作用”,一個(gè)基因?qū)α硪粋€(gè)的影響還取決于其他基因的狀態(tài),為理解多基因調(diào)控提供了新的視角。
![]()
圖5. 上:基因。現(xiàn)有公式和修正公式;節(jié)點(diǎn)活動(dòng)與真實(shí)值吻合(不同顏色代表不同表達(dá)的基因)。下:微生物群落。現(xiàn)有公式和修正公式,節(jié)點(diǎn)活動(dòng)比現(xiàn)有公式更符合真實(shí)值(不同顏色代表不同種群)
在微生物群落動(dòng)力學(xué)中,經(jīng)典的 Lotka–Volterra 方程假設(shè)物種間競爭或共生的強(qiáng)度與種群規(guī)模正相關(guān)。ND2 結(jié)果顯示這一假設(shè)并不成立:當(dāng)某個(gè)物種數(shù)量增多時(shí),其對(duì)其他物種的敏感性反而減弱。新發(fā)現(xiàn)的公式形式用飽和型函數(shù)描述這種效應(yīng),揭示了群落穩(wěn)定性的自調(diào)節(jié)機(jī)制。
社會(huì)系統(tǒng):理解社會(huì)復(fù)雜性
ND2還被用于分析全球人類流動(dòng)網(wǎng)絡(luò)上的新冠疫情傳播。研究團(tuán)隊(duì)將七個(gè)地區(qū)(包括美國、中國、紐約、伊利諾伊等)的確診數(shù)據(jù)與交通流量結(jié)合建模。結(jié)果顯示,不同區(qū)域的傳播方程形式雖有差異,但都遵循相同的規(guī)律:節(jié)點(diǎn)間的傳播影響強(qiáng)度呈現(xiàn)冪律分布(power-law distribution),其指數(shù)約為?0.8,說明疫情傳播在多尺度網(wǎng)絡(luò)中具有普適性。
![]()
圖 6: 新冠疫情傳播。a. 不同國家空間尺度傳播網(wǎng)絡(luò)。b. ND2 自動(dòng)發(fā)現(xiàn)的傳播方程。e. 節(jié)點(diǎn)相關(guān)性的冪律分布。f. 兩國自演化項(xiàng) W(x) 的差異
進(jìn)一步比較發(fā)現(xiàn),中國和美國的傳播動(dòng)力學(xué)存在顯著差異。中國模型中的自演化項(xiàng)(self-evolution term)表現(xiàn)出明顯的自抑制效應(yīng),即病例數(shù)上升會(huì)自動(dòng)減緩增長;而美國的模型則近似線性,反映出兩國在非藥物干預(yù)策不同。通過穩(wěn)態(tài)分析(steady-state analysis),作者甚至推算出了中國疫情傳播的“臨界點(diǎn)”:當(dāng)跨省流動(dòng)βeff超過閾值 βc 時(shí),疫情會(huì)從可控狀態(tài)躍遷為爆發(fā)狀態(tài)。這種從數(shù)據(jù)中自動(dòng)獲得的動(dòng)力學(xué)洞見,正是復(fù)雜系統(tǒng)科學(xué)長期追求的“可解釋預(yù)測”。
當(dāng) AI 成為科學(xué)的合作者
在科學(xué)史上,從開普勒到牛頓,從麥克斯韋到洛特卡,每一次發(fā)現(xiàn)自然規(guī)律的過程,都依賴人類的洞察與直覺。如今,ND2 展示了另一種可能:AI 不再只是分析工具,而是科學(xué)規(guī)律的共同發(fā)現(xiàn)者。
當(dāng)一臺(tái)算法能自動(dòng)讀懂?dāng)?shù)據(jù)背后的動(dòng)力學(xué)、提出修正后的理論,并揭示自然界的隱藏規(guī)律,我們或許正站在一個(gè)新的科學(xué)范式的起點(diǎn)——讓機(jī)器成為科學(xué)的“共作者”,讓復(fù)雜系統(tǒng)的秘密,在數(shù)據(jù)與公式之間自動(dòng)顯現(xiàn)。
復(fù)雜系統(tǒng)自動(dòng)建模讀書會(huì)第二季
“復(fù)雜世界,簡單規(guī)則。”
集智俱樂部聯(lián)合復(fù)旦大學(xué)智能復(fù)雜體系實(shí)驗(yàn)室青年研究員朱群喜、浙江大學(xué)百人計(jì)劃研究員李樵風(fēng)、清華大學(xué)電子工程系數(shù)據(jù)科學(xué)與智能實(shí)驗(yàn)室博士后研究員丁璟韜、美國東北大學(xué)物理系A(chǔ)lbert-László Barabási指導(dǎo)的博士后高婷婷、北京大學(xué)博雅博士后曹文祺、復(fù)旦大學(xué)數(shù)學(xué)科學(xué)學(xué)院應(yīng)用數(shù)學(xué)方向博士研究生趙伯林、北京師范大學(xué)系統(tǒng)科學(xué)學(xué)院博士研究生牟牧云,共同發(fā)起。
讀書會(huì)將于9月5日起每周四晚上20:00-22:00進(jìn)行,探討四個(gè)核心模塊:數(shù)據(jù)驅(qū)動(dòng)的復(fù)雜系統(tǒng)建模、復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)推斷、具有可解釋性的復(fù)雜系統(tǒng)推斷(動(dòng)力學(xué)+網(wǎng)絡(luò)結(jié)構(gòu))、應(yīng)用-超材料設(shè)計(jì)和城市系統(tǒng),通過重點(diǎn)討論75篇經(jīng)典、前沿的重要文獻(xiàn),從黑盒(數(shù)據(jù)驅(qū)動(dòng))到白盒(可解釋性),逐步捕捉系統(tǒng)的“本質(zhì)”規(guī)律,幫助大家更好的認(rèn)識(shí)、理解、預(yù)測、控制、設(shè)計(jì)復(fù)雜系統(tǒng),為相關(guān)領(lǐng)域的研究和應(yīng)用提供洞見。讀書會(huì)已完結(jié),現(xiàn)在報(bào)名可加入社群并解鎖回放視頻權(quán)限。
詳情請(qǐng)見:
1.
2.
3.
4.
5.
6.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.