Structural Similarity: Formalizing Analogies Using Category Theory
結構相似性:使用范疇論形式化類比
https://www.mdpi.com/2813-0405/3/4/12?utm_source=chatgpt.com
![]()
![]()
摘要
類比是人類認知中用于學習和發現新概念的重要組成部分。關于類比的定義以及如何發現或構建新類比,存在許多不同的方法。我們提出了一種新穎的方法,該方法延續了結構映射(structure mapping)的傳統,使用著色多重圖(colored multigraphs)來表示領域。我們定義了一個著色多重圖的范疇(category),以便利用某些范疇論(Category Theory, CT)的概念。范疇論是一種描述和處理保結構映射(structure-preserving maps)的強大工具。該理論在認知科學中有諸多有用的應用,我們希望向更廣泛的受眾介紹其中一種應用。本文對范疇論及其所使用的概念進行了介紹和闡釋。我們展示了如何在著色多重圖范疇中運用范疇論中的“積”(product)和“拉回”(pullback)等概念,根據不同的要求來發現領域之間可能存在的類比關系。隨后,我們利用拉回的對偶概念——“推出”(pushout)——作為概念整合(conceptual blending)的手段,以生成一個新的領域。
關鍵詞:類比;范疇論;結構映射;著色多重圖
引言
類比被視為人類認知的核心要素,因為它們在教學、學習以及新概念的形成中發揮著重要作用[1,2]。兩個領域之間的相似性可用于將知識從一個領域遷移到另一個領域,從而獲得新的洞見或解釋復雜概念。關于類比,存在諸多問題,例如:如何最好地定義類比?如何從兩個領域中構建類比?什么樣的類比才算“好”?當在人工智能推理中引入類比以提升其性能或增強其可解釋性時,這些問題同樣至關重要。任何類比方法的關鍵部分都在于對所涉知識和概念的表示方式[3]。例如,Liu 等人[4]將知識圖譜嵌入到一個抽象的線性空間中,以實現關系從一個領域到另一個領域的遷移。Gentner 提出的結構映射理論(structure mapping theory)[5]則專注于僅基于結構的領域間映射,并已被用于結構映射引擎(structure mapping engine)[6]中自動生成類比。
在本文中,我們使用范疇論(Category Theory, CT)——一個關注保結構映射(structure-preserving maps)的一般性和特定性質的數學領域——將領域定義為著色多重圖范疇中的對象,而將類比定義為這些對象之間的態射(maps)。這種基于范疇論的類比視角使我們能夠運用范疇論的概念來分析這些映射及其所包含的信息。
在本節剩余部分,我們將介紹我們的類比概念,并輔以一個具體示例和范疇論的基本概念。主體部分將把類比形式化為著色多重圖范疇中的態射,并展示如何利用范疇論中的“拉回”(pullback)和“推出”(pushout)概念,構建新的著色圖,以表示兩個領域之間可能的類比和概念整合(blends)。
1.1 類比
一個類比包含兩個領域:源域(base)和目標域(target),以及它們之間的一個映射[5]。該映射引出兩者共有結構的一種泛化形式,可用于將知識從源域遷移到目標域,或生成一個融合兩者特性的新概念(即概念整合,concept blending)。結構映射[5]是一種經典的尋找兩個領域共性的方法,它關注的是各領域之間的共享結構,而非所涉對象的屬性。一個常見例子是:太陽系類似于玻爾的氫原子模型,因為太陽與行星之間的某些關系類似于原子核與電子之間的關系[5]。
在示例中,領域通常被表示為有向多重圖(directed multigraphs),其中節點代表對象,邊代表這些對象之間的關系(見圖1中的示例)。我們引入一種基于此類有向多重圖的領域形式化方法。領域中的每個節點和邊都有一個名稱,用于相互區分,并且兩個節點之間可能存在多條邊。一個多重圖由兩個集合構成:節點集合 N 和邊集合 E,以及兩個函數 s 和 t,它們從 E 映射到 N,分別將每條邊 e 映射到其源節點 s(e) 和目標節點 t(e)。在結構映射中,對象之間的關系是判斷哪些對象被視為相似的決定性特征,而對象自身的屬性則不予考慮。我們為有向多重圖的邊添加“著色”(coloring),以捕捉某些關系是相同或相似的這一事實。著色由一個顏色集合 C 和一個函數 c 描述,該函數將每條邊映射到其對應的顏色。在圖1的例子中,太陽與行星之間的引力關系可與原子核和電子之間的引力關系相對應,但太陽與原子核本身的屬性之間并不存在明顯的相似性。
![]()
圖中的邊表示二元關系,因此我們只能用多重圖來描述包含二元關系(以及通過自環表示的一元關系)的領域。本文也不涉及高階謂詞。高階謂詞和 n 元關系可以通過其他領域表示方法納入,例如使用范疇和類型的方式,如 Ott 和 J?kel [7] 所述。我們使用一個著色圖的范疇來形式化類比并確定可能的映射。
1.2 范疇論
范疇論(CT)是一種連接眾多數學領域的理論。它通過對數學對象進行抽象描述——重點關注對象之間的關系——來揭示并利用這些對象之間的共性與差異。因此,范疇論本身可被視為一種關于數學對象之間類比的理論。此前已有研究建議在認知科學中,特別是類比構建的建模中使用范疇論,例如:使用交換圖(commutative diagrams)來分析類比,并用余等化子(coequalizers)描述重新表征(re-representation)[8];或使用函子(functors)描述一個抽象概念在源域和目標域中的具體實例化,并用這些函子之間的自然變換(natural transformation)來描述類比[9]。范疇中的保結構態射(structure-preserving morphisms)可與大多數形式化方法結合使用,例如啟發式驅動的理論投射(Heuristic-Driven Theory Projection)[10]。
![]()
![]()
![]()
在討論態射時,一個關鍵問題是某些態射或組合是否彼此相等。范疇的某些部分可以很好地用圖表表示,其中箭頭代表態射;若所有具有相同起點和終點的有向路徑(即具有相同定義域和陪域的態射復合)都相等,則稱該圖為交換圖(commuting diagram)。
我們現在可以定義著色多重圖的范疇,并展示如何利用范疇論中的“拉回”(pullback)和“推出”(pushout)概念來描述類比。
類比的形式化
在本節中,我們使用著色有向多重圖的范疇來形式化類比。我們將首先定義相應的范疇,然后展示如何利用范疇論中的“拉回”和“推出”概念,對類比理論中的核心概念進行形式化。
2.1 領域的范疇
我們希望聚焦于領域之間的關系映射,以此作為發現和構建類比的基礎。每個領域由對象(例如:太陽和行星)以及這些對象之間的關系(例如:太陽吸引行星)組成。關系總是具有方向性(“太陽比行星大”與“行星比太陽大”并不相同),且每對對象之間可以存在多種關系。如前所述,領域被建模為帶有自環的有向多重圖。為邊添加顏色,用以表示不同邊之間的相似性。例如,在圖1中,“吸引”關系彼此之間比與“更熱”關系有更多的共同點。從本節起,帶顏色的有向多重圖將簡稱為“著色圖”。
我們現在希望形式化定義一個著色圖的范疇 ColG,以便更好地分析著色圖之間映射的結構。我們擴展第1.2節中的定義,將其納入顏色因素。ColG 中的每個對象是一個著色圖,包含三個集合:節點集 N、邊集 E 和顏色集 C。除了將每條邊映射到其源節點(s: E → N)和目標節點(t: E → N)的函數外,還有一個將每條邊映射到其顏色的函數(c: E → C)。這里的“顏色”不限于傳統意義上的色彩,而可視為一種通用標簽。
![]()
![]()
到目前為止,我們已將領域的重要結構信息編碼到著色圖中,并定義了能夠保持這種結構的態射。然而,兩個圖之間可能存在許多態射,并非每一個態射都能構成一個好的類比。此外,還有一個額外的問題:態射必須映射整個圖。例如,太陽系圖 S中的“更熱”(hotter)邊在原子圖 A中沒有對應項,但仍會被某個態射強制映射到 A中的某些其他邊上。
我們現在希望利用“積”(product)和“拉回”(pullback)這兩個概念,來構建領域之間可能的映射——這些映射受到更多限制,同時允許部分對應(partial correspondence)。
2.2 基于可能類比的拉回
接下來我們要引入的概念是“積”,它是集合笛卡爾積(Cartesian product)的范疇論推廣。一個范疇中兩個對象的積是該范疇中的另一個對象,它包含了這兩個因子對象的全部信息。圖3a通過一個交換圖展示了積的結構。
![]()
一個乘積在同構意義下是唯一的。類別Set包含每一對集合的笛卡爾積和相應的投影,這些投影滿足上面定義的乘積的性質。因此,Set具有所有乘積。這對每個類別來說并不一定成立。
![]()
![]()
以上述太陽系的例子而言,積會產生一個包含大量邊的龐大圖,因為所有可能的邊映射組合都被考慮在內。接下來我們將定義拉回(pullback),并探討如何通過對一個簡單圖取拉回,強制僅將特定顏色的邊與其他同色邊進行組合。
![]()
![]()
![]()
所有符合圖顏色約束的可能類比都被疊加在拉回圖中。
圖5所示的拉回示例中不包含太陽與行星之間的“更熱”(hotter)關系,因為在氫原子中不存在對應的邊。
我們現在可以在拉回圖的相應子圖中,考察將火星(Mars)、金星(Venus)和太陽(Sun)這些節點與電子(electron)和原子核(nucleus)節點進行配對的所有可能組合。
對于兩個領域節點之間的單射映射(injective mappings),共有六種可能的配對組合。每種配對由圖 S 中的一個節點和圖 A 中的一個節點組成,而一個子圖則由其中兩個這樣的配對構成。
該拉回圖的相應子圖包含了這兩個節點對之間的所有邊。
圖6展示了這六個生成的子圖:其中兩個子圖不含任何邊(a、b),兩個子圖僅包含兩條邊(c、d),還有兩個子圖包含四條邊(e、f)。
![]()
最后這兩種子圖包含最多的結構,因此是更優的映射。它們對應于將太陽與原子核匹配、并將某一行星與電子匹配的情形,這兩種映射同樣有效。
我們可以通過修改映射 f和 g來放寬對顏色匹配的要求。如果兩種不同顏色的邊被映射到同一條邊,那么它們的所有組合都會出現在拉回圖中。另一種方法是通過向中間圖添加節點和邊,來強制某些特定的節點或邊必須匹配。因此,拉回可用于基于先驗知識生成一個疊加了所有可能類比的圖。隨后,我們可以重構所有可能的匹配,并以子圖中邊的數量作為偏好排序的依據。
圖7展示了另一個基于不同中間圖的拉回。該中間圖現在包含三個節點(而非一個)和四條顏色均為黑色的邊。這個圖所編碼的約束條件與圖5中的不同。在這里,節點已經被預先配對:態射 f將節點 mars 映射到 m,sun 映射到 s,n,venus 映射到 v,e;而態射 g將 nucleus 映射到 s,n,electron 映射到 v,e。然而,每條邊都被映射到中間圖中唯一一條具有正確源點和目標點的邊,以滿足圖態射的條件,而不再考慮任何顏色約束,因為中間圖未對顏色進行區分。
![]()
所得到的拉回圖僅包含兩對節點:sun 與 nucleus、venus 與 electron,因為節點 m僅被原始兩個圖中的一個所匹配。但由于邊的顏色未被區分,太陽系圖 S和原子圖 A中所有具有正確源點和目標點的邊的組合,都在拉回圖中得到了表示。
在此例中,由于映射到單色(uni-colored)中間圖時丟失了顏色所承載的區分信息,導致拉回圖中出現了大量可能的邊。在這種情況下,要判斷哪些邊應被用于子圖以描述類比就變得更加困難。
2.3 利用推出進行概念整合(Blending)
我們可以利用從一個領域到另一個領域的部分映射來構建一個新的組合領域,即所謂的“概念整合”(conceptual blend)。我們基于使用推出(pushout)實現這種概念整合的思想[15,16],來定義從源域(base domain)到目標域(target domain)的非對稱知識遷移。
范疇論中的許多概念都存在對偶形式,即把所有態射的方向反轉。積(product)的對偶稱為余積(coproduct),它是兩個集合不交并(disjoint union)的推廣。圖8a展示了描述余積的交換圖。
![]()
![]()
我們首先通過拉回構建了一個包含所有可能類比的圖,如圖5所示。圖6中得到的各個子圖描述了不同的類比關系,并可用于通過推出(pushout)生成一個整合圖(blended graph)。在圖9的示例中,我們選擇了圖6中的子圖(f),因為它是邊數最多的子圖之一。所生成的整合圖包含這一公共子圖,此外還包含兩個原始圖中出現但未包含在公共子圖中的所有節點和邊。
![]()
對該子圖進行推出——其中將太陽(sun)與原子核(nucleus)匹配、金星(venus)與電子(electron)匹配——得到一個新圖:該圖包含這兩個被合并的節點及其合并后的邊,以及一個額外的節點“火星”(Mars)和若干額外的邊。在整合圖中對火星的這種安排,可以被理解為暗示此類系統中可能存在多個環繞運行的物體,從而引申出原子中可能存在多個電子的概念。同時被遷移過來的“更熱”(hotter)關系則提示我們:在使用此類比進行解釋時,必須明確指出這一差異,以避免錯誤的知識遷移或產生混淆。
我們從一個簡單的圖出發,用于匹配兩個領域圖的顏色,構建了一個拉回(pullback),以找出類比的所有可能匹配。隨后,從中選取其中一個匹配(以拉回圖的一個子圖形式表示),并將其用于推出(pushout),以生成一個整合圖(blended graph)。
討論
我們將知識領域形式化為著色多重圖,并運用范疇論(CT)展示了如何利用這種結構來描述并發現兩個領域之間可能的類比。我們通過對一個表達先驗知識的圖取拉回(pullback),生成了一個包含所有可能映射的新圖。隨后,我們選取該拉回圖中描述某一可能匹配的子圖,并將其用于推出(pushout),以構建兩個領域的整合(blend)。
我們并不假設人類在發現、教授或學習類比時實際使用了范疇論,但我們知道人類確實能夠執行某種關系之間的映射,而本文所提出的方法正是對這一過程的一種形式化描述。我們展示了范疇論在此類問題中的實用性。
著色圖是領域的一種常見可視化表示,而范疇 ColG 提供了構建匹配與整合的基本工具。然而,這種形式化方法最適合處理二元關系和一階關系。Ott 和 J?kel [7] 提出了另一種基于相同思想但更為抽象的方法,可用于納入 n 元關系和高階關系。
本文僅展示了該方法潛力的一小部分。下一步工作可以是更明確地界定在眾多可能的類比中應選用哪一個。這可以通過為領域圖賦予更多信息來實現,例如標明哪些關系對定義該領域最為關鍵。此外,本文所使用的方法也可被實現于自動類比生成系統中。對領域及其類比關系的良好形式化,不僅有助于我們更深入地理解人類推理機制,還能用于改進人工智能推理系統,使其對人類用戶而言更具可解釋性和可理解性。
原文鏈接:https://www.mdpi.com/2813-0405/3/4/12?utm_source=chatgpt.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.