![]()
人類生活在三維世界,但探索的觸角早已延伸至更高維的數學世界。從物理理論到人工智能,高維數學正在揭示隱藏在復雜現象背后的結構與規律。
撰文 | Benjamin Skuse
翻譯 | zzllrr小樂
從直覺上來說,我們能夠想象一個一維實體,它永遠只能在一條無限延伸的直線上移動;或者一個二維生物,它注定只能生活在一個平坦的平面上。而三維生物無需我們刻意想象,因為這正是我們感知宇宙的方式。然而,驅動現代世界運轉的計算能力,卻在五維、十維乃至數千維的抽象空間中蓬勃發展。高維數學究竟是如何幫助我們處理和解讀信息,又如何揭示那些支配著從生物學到人工智能等萬事萬物的隱藏規律呢?
超越感知的維度
我們不妨先區分“宇宙的維度”與“維度”的其他定義,這是一個不錯的切入點。如果討論的是前者,那么核心問題便是:我們是否真的生活在一個三維宇宙中?抑或這只是我們感知方式的局限所致?左與右、前與后、上與下,這是我們僅有的移動方向,也是我們感知到三維世界的原因。但阿爾伯特·愛因斯坦(Albert Einstein)的出現改變了這一切。他提出的狹義相對論與廣義相對論將時間納入了考量范疇。盡管我們只能感知到時間的單向流逝,其體驗方式與三維空間維度截然不同(從數學角度而言亦是如此),但相對論將空間與時間整合為一個整體,即時空(spacetime)。
數學家赫爾曼·閔可夫斯基(Hermann Minkowski)的研究讓時空的數學表達變得具象化。他證明,若將空間與時間置于近乎平等的地位,狹義相對論便能得到簡潔優美的闡釋。這種統一視角催生了閔可夫斯基空間(Minkowski space)的概念——這是一個四維空間,時間被視為第四個坐標。
這項研究為將時空視為單一四維結構奠定了基礎。在數學術語中,這種結構被稱為流形(manifold),它并非一成不變,而是會受到質量或能量的影響。當靠近黑洞這類大質量天體時,空間確實會被拉伸,時間亦是如此。換句話說,這個四維流形的維度會發生幾何扭曲。
一個多世紀前,相對論帶來的啟示讓人們意識到,我們所處的宇宙或許擁有三個以上的維度,并以一種深刻的方式說明,我們感知到的事物未必就是全部現實。但更多的突破性發現還在后面。

超立方體(左)與立方體(右)折疊和展開過程示意圖丨圖源:Christopher Thomas (CC-BY-SA 1.0)
在愛因斯坦向世界提出廣義相對論后不久,德國數學家特奧多爾·卡魯扎(Theodor Kaluza)與瑞典物理學家奧斯卡·克萊因(Oskar Klein)意識到,這個理論中還少了點什么:另一個空間維度。兩人證明,倘若宇宙是五維而非四維的,那么五維形式的愛因斯坦方程將可以分解為三組四維方程,分別是描述引力的愛因斯坦原始場方程、描述電磁力的麥克斯韋方程,以及一個全新的標量場方程。
這個新增的第四空間維度可以蜷縮成一個極小的閉合環路,其半徑遠小于任何可測量尺度——這也解釋了為何我們無法感知到它的存在。但與此同時,它卻可能對我們周遭的世界產生深遠影響,堪稱是實現引力與電磁力統一的“秘訣”。
這便是后來著名的卡魯扎-克萊因理論(Kaluza–Klein theory),它在數學層面精妙絕倫,但在物理層面卻存在缺陷。該理論無法準確預測粒子的屬性,也未能涵蓋另外兩種基本作用力(強核力與弱核力)以及諸多基本粒子。盡管如此,它是首次嚴肅嘗試證明,我們所感知到的基本相互作用,或許只是高維幾何結構的一種表現形式。如今,這一理論的思想遺產依然延續,催生出一系列試圖通過多個蜷縮空間維度來統一基本作用力與粒子的理論,例如弦理論(String theory)與M理論(M-theory)——后者由1990年菲爾茲獎得主愛德華·威滕(Edward Witten)首次提出。
四維廣義相對論、五維卡魯扎-克萊因理論,以及十維、十一維的弦理論與M理論都暗示,我們宇宙的幾何結構或許遠比我們能感知到的更為奇特。但這些理論所涉及的維度,在數學家與統計學家研究的高維范疇中,還處于“低維”水平。那么,為何人們要涉足這些高度抽象的領域呢?
定義數據
當我們描述某個N維空間內一個點的位置時,高維數學的作用就變得易于理解了。前文提到的那個在無限直線上移動的一維生物,只需一個坐標(x)就能確定其位置;平面上的二維生物需要兩個坐標(x,y);而我們人類,若只考慮空間位置,用三個坐標(x,y,z)即可定位;若要同時描述時空位置,則需要四個坐標(x,y,z,t)。
![]()
一維、二維與三維生物示意圖丨本圖在Google Gemini的協助下制作。
高維空間中的點,其實只是擁有更多的坐標而已。當我們不再將維度視為宇宙的構成要素,而是從其他角度定義維度時,高維空間的價值便凸顯出來。我們不妨將維度理解為在特定空間中被考慮的屬性或變量的數量,而非可能存在的現實。例如,金融模型師想要追蹤并預測某項資產的風險,就可以將其視為N維風險空間(N-dimensional risk space)中的一個點,其中N代表多種變量,如當前價格、波動率、利率等。
另一個典型例子是人口普查數據。政府的人口普查數據庫包含數百個關于人口(年齡、性別、種族、職業等)和家庭(住房類型、產權狀況、臥室數量等)的變量。這樣一來,每個人就成為了數據庫這個N維空間中的一個點,N對應的是普查中測量的數百種不同特征。
在這兩個例子中,想要獲取有價值的洞見,關鍵在于發現并分析隱藏在高維數據中的低維模式與結構。金融模型師可以運行算法,在高維風險空間中尋找一個超平面(hyperplane),以此將安全投資與高風險投資進行最優劃分。統計學家則可以將原始變量整合為主成分(principal components)——這些主成分能夠反映不同群體在社會經濟地位上的主要差異,進而構建出基于區域的貧困指數(deprivation index)。
高維數學的重要性還體現在一個當下的熱門領域中,即大語言模型(large language models, LLMs)。這類模型的發展得益于約書亞·本吉奧(Yoshua Bengio)與楊立昆(Yann LeCun)等研究者數十年來在人工智能、機器學習與自然語言處理領域的深耕——兩人均是2018年圖靈獎(ACM A.M. Turing Award)得主。事實上,沒有高維數學,大語言模型便無從運轉。
![]()
約書亞·本吉奧與楊立昆分別出席2019年與2022年海德堡獲獎者論壇丨圖源:HLFF / Flemming
大語言模型中,文本完全通過向量數學(vector mathematics)處理。模型會將每個“標記(token)”(可以是單詞、子或標點符號)轉換為一個高維向量,其維度通常在512至4096之間,同時標記在序列(句子)中的位置也會被編碼為附加向量。模型的運算主要由自注意力機制(self-attention mechanism)驅動:通過計算高維向量之間的點積(dot product)來衡量所有標記之間的語義關聯,進而生成一系列新的高維向量,這些向量包含了給定序列的上下文信息。最終生成的輸出向量會被映射到詞匯空間(vocabulary space),該空間的維度等于模型詞匯表中可能存在的標記數量。最后,模型會通過一個函數篩選出合適的標記,完成文本生成。
復雜性的形態
當大型數據集包含本身就是高維向量的數據點時,數據分析并獲得有用信息的難度便會大幅提升。例如在單細包RNA測序技術中,每個單細胞都被表示為一個向量,其維度對應數萬個基因的表達水平。想要理解如此龐大而稀疏的空間,需要采用一種截然不同的方法。
如果我們將這個空間視為一個巨大的數據云(data cloud),忽略其中具體的坐標信息,就能退一步,從宏觀上把握數據的“形態”。這種方法被稱為拓撲數據分析(Topological Data Analysis, TDA),它能夠刻畫高維數據流形的全局結構與連通性。這類分析方法源于現代拓撲學,其理論基礎包括1982年菲爾茲獎得主丘成桐(Shing-Tung Yau)關于彎曲空間的幾何分析,以及1986年菲爾茲獎得主邁克爾·弗里德曼(Michael Freedman)在流形結構領域的深刻洞見。
拓撲數據分析借助持續同調(persistent homology)識別數據的拓撲特征——這些特征是數據形態的固有屬性,即便數據被拉伸、壓縮或進行連續變換,它們也不會發生改變。此類結構包括簇、環與空洞,它們的存在往往蘊含其他方法難以發現的深層信息。
這一技術在癌癥基因組學中已產生重要影響。研究人員利用拓撲數據分析,識別出了具有特定預后的乳腺癌患者亞群,而傳統方法未能發現這一群體。這一發現為精準治療奠定了基礎。此外,該方法還被用于識別可預測治療反應與患者預后的基因組標記物,準確性較高。
無限的循環
當我們的研究超越這些已經極高的維度時,我們又會回到一切的起點:探究現實與宇宙的本質。在創立相對論的同時,愛因斯坦也是現代物理學另一大支柱——量子力學——的重要奠基人之一。量子力學描述了原子與亞原子尺度下物質與光的運行規律。在這一尺度下,對物理現象的數學描述需要滿足空間上的連續性,同時還要遵循疊加原理(principle of superposition),即在被觀測之前,物理系統(波或粒子)可以同時處于所有可能的狀態。
這些特性導致量子系統具有無窮多的潛在自由度,也就是無限維度。而這種復雜性,就需要借助泛函分析(functional analysis)這一數學分支來處理。泛函分析將函數視為無窮維空間中的點或向量,而希爾伯特空間(Hilbert space)正是量子態所處的一種特殊無窮維向量空間。事實上,由著名的全才型學者約翰·馮·諾依曼(John von Neumann)嚴格構建,并經著名數學家伊斯雷爾·蓋爾范德(Israel Gelfand)與1962年菲爾茲獎得主拉爾斯·霍爾曼德(Lars H?rmander)進一步推廣的無窮維希爾伯特空間框架,構成了量子力學的數學基石。倘若沒有泛函分析與希爾伯特空間理論,我們便無法準確定義量子態、量化概率,也無法描述亞原子世界的連續動力學過程。
正如我們所看到的,日常感知的局限反而成為深入理解世界的起點。如今,我們不再局限于對三維世界的觀察,而是掌握了構建和探索任意維度空間的數學語言,這讓我們在眾多領域與應用中,都獲得了全新而深刻的認知。
作者簡介
Benjamin Skuse是一位專注于科學領域的專業自由撰稿人。他早年曾從事學術研究,獲得愛丁堡大學應用數學博士學位和科學傳播碩士學位。目前他居住在英國西鄉地區,致力于為各類讀者創作通俗易懂、引人入勝且具有說服力的文章——無論主題內容有多復雜。他的作品曾發表在New Scientist、Sky & Telescope、BBC Sky at Night Magazine和Physics World等雜志上。
本文經授權轉自zzllrr小樂公眾號,原文譯自Benjamin Skuse,How High-Dimensional Mathematics Rules Our World,Heidelberg Laureate Forum,
https://scilogs.spektrum.de/hlf/how-high-dimensional-mathematics-rules-our-world/
注:本文封面圖片來自版權圖庫,轉載使用可能引發版權糾紛。
![]()
特 別 提 示
1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。
2.『返樸』提供按月檢索文章功能。關注公眾號,回復四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.