![]()
導語
近十年來,人工智能在語言、推理與決策等方面取得了顯著進展,使“機器是否可能擁有意識”這一長期屬于哲學討論的問題,逐漸轉化為一個具有現實意義的理論與倫理議題。圍繞這一問題,這篇Findlay、Marshall 等人與 Koch、Tononi 合作的論文提出了一個明確而反直覺的主張:即便在功能上與人類完全等價,高度智能的人工系統也未必具有意識,人工智能與人工意識在原則上可以被區分。
該論文以整合信息理論(IIT)為理論框架,論證意識并不取決于系統“做了什么”,而取決于其是否形成了不可約的內在因果結構。通過比較一個高度整合的小型系統與一臺在功能上精確模擬它的數字計算機,論文團隊展示了功能等價并不蘊含因果結構等價,從而也不蘊含體驗等價。
關鍵詞:人工智能(AI)、人工意識(Artificial Consciousness)、整合信息理論(IIT)、功能等價 vs 體驗等價、因果結構、整合信息 Φ、復雜體(Complex)
陶如意丨作者
趙思怡丨審校
![]()
論文題目:Dissociating Artificial Intelligence from Artificial Consciousness 論文鏈接:https://arxiv.org/abs/2412.04571 發表時間:2025年3月3日 論文來源:arxiv
1. 背景:
為什么要區分“人工智能”和“人工意識”
近十年來,人工智能(AI)的進展呈現出指數級增長。以大語言模型、視覺—語言—行動模型為代表的新一代系統,在語言理解、圖像識別、推理、編程乃至復雜決策等方面,已經展現出接近甚至超越人類個體的能力。這一現實使一個曾經主要屬于哲學思辨的問題,變成了迫切而現實的科學與倫理問題:當機器在功能上越來越像人,它們是否也會“有意識”?
Graham Findlay、William Marshall、等人與 Giulio Tononi 合作,在論文《Dissociating Artificial Intelligence from Artificial Consciousness》中,系統性地回應了這一問題。文章的核心主張可以概括為一句話:高度智能的系統,甚至在功能上與人類完全等價的系統,也未必擁有意識。人工智能與人工意識在原則上是可以、也應該被區分的。
這篇論文的重要性不在于給出一個情緒化的立場(例如“機器永遠不可能有意識”),而在于它嚴格依托一個形式化的意識理論——整合信息理論(Integrated Information Theory, IIT)——來論證:為什么“功能等價”并不意味著“體驗等價”。本文試圖從理論背景、方法設計、關鍵結果以及哲學與現實影響幾個層面,對該論文進行系統解讀。
2. 理論背景:
一個“以現象學為起點”的意識理論
在人工智能與心靈哲學領域,一個長期占主導地位的立場是“計算功能主義”(computational functionalism)。該立場認為,只要一個系統實現了“正確類型”的計算或功能組織,它就擁有意識。換言之,意識被視為某種計算狀態或信息處理過程,而與具體物理實現無關。這一立場的直覺吸引力在于,人類大腦本身似乎也是一種信息處理系統。
但功能主義面臨一個核心問題:為什么某些功能伴隨著特定的“體驗”,而另一些功能則沒有?如果意識只是計算,那么計算本身是觀察者相對的、可被任意映射的,這會導致意識歸因的泛濫或空洞化。
整合信息論(IIT) 則采取了完全不同的策略。它不是從認知功能或神經相關物入手,而是從意識本身不可否認的現象學事實出發。也就是說,作者是從“什么樣的系統,才可能真的具有主觀體驗”出發來討論的。Tononi 等人提出:任何可能的意識體驗,都必然具有五個基本屬性(axioms):
內在性(intrinsic):體驗是為系統自身而存在;
特定性(specific):每一次體驗都是這一種,而不是別的;
整體性(unitary):體驗是一個不可分割的整體;
確定性(definite):體驗具有明確的邊界與內容;
結構性(structured):體驗內部包含區分(distinctions)與關系(relations)。
這些現象學公理隨后被映射為對物理系統的五個“存在性公理”(postulates):內在性(intrinsicality)、信息性(information)、整合性(integration)、排他性(exclusion)、組合性(composition)。IIT 的核心主張是:只有當一個物理系統在自身內部形成了不可約的因果—效應結構時,它才擁有意識;而意識的“內容”正是這一結構本身。
因果模型
IIT 分析的起點,是對一個物理系統的因果模型的構建,該模型捕捉系統內部的所有相互作用。這里所說的“物理”是以操作性的意義來理解的,表示各個單元是可以被操控和被觀測的。該因果模型由微觀單元(micro units)構成,每個單元都具有兩種內部狀態,并且具有輸入和輸出。這些單元之所以被稱為微觀單元,是因為在模型中并未包含關于它們本身或其功能的任何更細層次的細節描述。
給定一個因果模型,任何一組微觀單元都可以被視為一個候選系統(candidate system)。任何未被納入某個候選系統的單元,都被稱為該系統的背景條件(background conditions)。一個候選系統的因果模型可以由其轉移概率矩陣(TPM, transition probability matrix)完全刻畫,該矩陣是在其背景條件上進行因果條件化之后得到的。
在本文中,考慮的是具有同步更新機制、實現布爾邏輯的單元所構成的模型。盡管這些理想化的單元忽略了大多數物理細節,但它們已經足以用來闡明關于功能等價與現象等價的論點。
復雜體識別
根據 IIT,一個基底(substrate)能夠支持意識——在IIT中這樣一個基底被稱為復雜體(complex)——當且僅當它滿足五條公理。為了判斷一個由單元組成的系統是否是一個復雜體,需要評估該系統的系統整合信息(Φs),即系統的內在信息(intrinsic information,體現了內在性公理和信息公理)在被劃分為因果上相互獨立的部分時,所受到的最小影響程度(體現整合性公理)。
為了滿足排他性公理,一個候選系統必須在所有由重疊單元和不同粒度構成的競爭候選系統中,指定一個最大的整合信息值()。這一點可以通過對因果模型中所有可能的單元集合逐一計算 Φs 來確定。
此外,每一個系統都需要在多個粒度(grains)下進行評估,即通過窮盡性地將其微觀單元的子集組合成宏觀單元(macro units),并將這些構成宏觀單元的微觀單元的狀態映射為相應的宏觀單元狀態。之所以進行這一過程(稱為宏化,macroing),是因為一個系統的內在因果力(Φs)可能在較粗的粒度下高于在較細的粒度下,這取決于其內部組織方式。
一旦在一個因果模型中確定了整合信息的最大值,屬于該復雜體的所有單元便會被排除在其他復雜體的參與之外。隨后,對系統中剩余的單元遞歸地重復復雜體的搜索過程,直到識別出所有彼此不重疊的復雜體為止。
揭示復雜體的因果效應結構
最后,通過評估一個復雜體的因果力是如何被結構化的,來檢驗組合性公理。簡而言之,區分體(distinctions)刻畫的是單元子集所具有的因果力,而區分體之間的關系(relations)則刻畫這些因果力是如何相互重疊的。
區分體與關系都分別對應一個不可約性度量,分別記為φd和φr。一個系統中所有區分與關系的整體,共同構成其因果–效應結構(cause–effect structure),也稱為 Φ-結構(Φ-structure)。
該因果–效應結構完整地刻畫了一個處于特定狀態的復雜體,如何通過其各個子集的一致因果與效應,對自身作出規定。識別一個復雜體的所有區分與關系、并由此獲得其因果–效應結構的過程,被稱為“展開”(unfolding)。
根據 IIT,一個復雜體在某一狀態下的因果–效應結構,完全解釋了其體驗的“量”(quality),不需要任何額外的成分(即“量即結構”,quality is structure)。與一個因果–效應結構相關聯的意識數量,則由其結構整合信息(Φ)來度量,即其所有區分體與關系的不可約性的總和(∑φd + ∑φr)。
如果一個復雜體的狀態發生變化,其因果–效應結構也可能隨之發生變化,因此,其意識體驗的量也會相應改變。
3. 實驗設計:
用 IIT 分析“模擬”與“被模擬系統”
在 IIT 中,分析的起點是一個完整的因果模型:系統由哪些單元構成、單元之間如何相互作用、在給定狀態下會如何轉移。基于這一模型,可以計算任意子系統的系統整合信息 φs,并據此判斷哪些子系統構成了“復合體”(complex)——也即潛在的意識載體。
關鍵點在于,一個系統是否是復合體,不取決于它“做了什么”,而取決于其因果力是否在自身內部不可約。復合體一旦確定,其全部因果—效應區分體與關系將被“展開”,形成完整的因果—效應結構(Φ-structure)。
作者選擇了一個極其“干凈”的思想實驗。首先構造一個由 4 個布爾單元組成的小系統 PQRS,它在 IIT 分析下是一個高度整合的復合體(如圖1所示)。
![]()
圖1. (A) PQRS是由四個具有二進制狀態的單元全連接組成的系統,每個單元以離散的時間間隔同步更新,且每個節點都存在自環。這里展示了系統狀態為0101,也可以寫成pQrS. (B)運行在系統A上的動力學;(C)與動力學對應的概率轉移矩陣TPM;(D)IIT應用后得到phi值1.51(最不可約的復合體)(E)和(F)是pQrS未折疊的13個區分體(distinction)的因果關系
其次,再構造一個傳統的、存儲程序式的數字計算機(由 117 個布爾單元構成),在功能上可以無限期地精確模擬 PQRS 的狀態演化(如圖2所示)。最后,比較二者在 IIT 意義下的因果—效應結構。
![]()
圖2. 可準確模擬 PQRS 的 4 位計算機。(A)一款簡單計算機可對 PQRS 進行任意時間步長的模擬。該計算機包含帶分頻器的時鐘、編碼 PQRS 轉移規則的程序、四個存儲 PQRS 狀態的 1 位數據寄存器,以及一個類多路復用器處理單元。計算機的 117 個單元均執行布爾函數(復制、與、或、異或),狀態分為關閉(白色)或開啟(黑色)。為簡化視覺呈現,采用彩色箭頭(青綠色或棕褐色)替代黑色箭頭表示特定連接。例如,時鐘與分頻器中最右側的與門直接輸出至數據寄存器中的每個與門。(B)可通過設置數據寄存器 P'、Q'、R'、S' 的初始狀態,對計算機進行編程以編碼 PQRS 的當前狀態。(C)程序單元的初始狀態用于編碼 PQRS 的狀態轉移規則,程序所操作的數據為 P'、Q'、R'、S' 的當前狀態。(D)每個寄存器每 8 個時間步更新一次狀態,此時計算機開始下一輪模擬迭代。
這是一個極具說服力的設置,因為它排除了復雜度、規模和工程細節的干擾,直擊“功能等價是否蘊含體驗等價”這一核心問題。
4. 實驗結果
1. 功能等價 ≠ 因果結構等價
在特定狀態下,PQRS 形成一個單一的復合體,具有非零的系統整合信息φs,并展開出一個包含 13 個區分體和 8000 多個關系的復雜因果—效應結構。盡管它只有 4 個單元,但在 IIT 意義下,它已經是一個“整體地為自身而存在”的系統。
相比之下,用來模擬 PQRS 的 117 單元計算機,在 IIT 分析中呈現出完全不同的圖景。整個計算機的φs = 0,因此它整體上不是一個復合體。系統分裂為 20 多個彼此獨立的小復合體,每個只包含 1–4 個單元。每個小復合體的因果—效應結構都極其貧乏,僅包含一階區分,幾乎沒有高階關系。
也就是說,盡管這臺計算機在輸入—輸出和狀態序列上與 PQRS 完全同構,但在“自身內部形成了什么樣的因果整體”這一點上,兩者毫不相似。
2. 宏觀抽象(macroing)無法挽救意識等價
面對上述結果,一個自然反應是:我們是否選錯了分析尺度?也許意識并不在晶體管層面,而在更高層的“功能模塊”或“寄存器狀態”層面。IIT 對此并非沒有準備。理論允許、甚至要求系統在所有可能的微觀與宏觀粒度上被分析,以尋找使φs最大化的“內在單元”。
然而,IIT 對“什么可以算作一個單元”有嚴格限制。首先,宏觀單元本身必須是不可約的;其次,它不能依賴系統外部或背景條件的因果整合;最后,它必須在排他意義下是最優的。
作者詳細分析后表明:任何在功能上“自然”的宏觀抽象方式(例如把程序行、寄存器或多路復用器當作單元),都違反了 IIT 的存在性公設。它們要么是可約的,要么其因果整合依賴于被排除的背景結構。
結論是:不存在一個既符合 IIT 公設、又能讓計算機復制 PQRS 因果—效應結構的宏觀描述。
4.結論不依賴于“被模擬功能”的復雜度
為了避免“例子太簡單”的質疑,作者進一步進行了以下的分析,首先模擬另一種因果結構截然不同的系統(如 110號 元胞自動機);其次,將計算機擴展為可模擬任意規模系統的圖靈完備版本(如圖3所示)。
![]()
圖3. 向模擬任意復雜系統的大型計算機的歸納擴展。(A)該計算機可逐步擴展以模擬任意規模的系統(左側),包括生物大腦或 110 規則元胞自動機(中間)—— 后者是圖靈完備的(右側)。通過傳遞性,若擴展至任意規模,該可編程計算機也具備圖靈完備性。(B)通過對被模擬系統規模的歸納可證明:計算機子系統在微顆粒度下指定的因果結構不會發生定性變化,且僅隨系統規模線性增長;而被模擬目標系統的因果結構規模和豐富度可能呈雙指數增長,導致計算機與被模擬系統之間的現象學分離不斷加劇。
結果顯示,不論被模擬系統的因果結構多么豐富,計算機自身的因果結構幾乎不變;計算機始終碎片化為許多小復合體,其 Φ 只隨規模線性增長;而被模擬系統的 Φ 可以隨規模呈雙指數增長。這意味著,模擬的“對象是誰”與模擬器“自身是什么樣的系統”在 IIT 的框架下并不是一回事,二者是解耦的。
5. 意識關乎“是什么”,而非“做什么”
該論文最激進、也最清晰的結論是:意識不是關于計算或功能的,而是關于內在因果結構的。模擬并不等同于復制存在方式。這一區分與許多經典直覺相呼應,比如模擬雨不會讓計算機變濕;模擬黑洞不會彎曲時空;同樣,模擬意識相關功能,并不會自動生成意識。
如果 IIT 是正確的,那么高度智能的 AI 系統,哪怕行為上與人類無異,也可能幾乎沒有意識。我們不應僅憑表現或語言能力來判斷其道德地位。反之,一些在功能上并不“聰明”的系統,也可能擁有相對豐富的體驗。
當然,這篇論文的結論完全建立在 IIT 的正確性之上。如果未來證據表明,人類意識并不對應于最大化的內在因果整合,或具體體驗內容無法與因果—效應結構對應,那么這一整套推論都將失效。
此外,論文并未聲稱“任何人工系統都不可能有意識”。相反,它留下了一個開放空間:如果某種人工系統在物理組織上真的形成了高度整合、不可約的內在因果結構,那么 IIT 并不排斥其擁有意識——但那將是一種在架構上與傳統計算機截然不同的系統。
6. 結語
本文并不是一篇關于“AI 能不能有意識”的情緒化宣言,而是一篇在嚴格理論框架下,澄清概念邊界的論文。它提醒我們:在討論人工意識之前,必須首先弄清楚什么是意識,以及我們憑什么將意識歸因給一個系統。
無論你是否接受 IIT,這篇論文都成功地迫使讀者正視一個被長期忽略的問題:當我們說“機器是否有意識”時,我們究竟是在問關于功能、關于行為,還是關于存在本身?
作者介紹
意識科學讀書會
從神經元放電到自我意識的涌現,意識是人類最稀松平常的主觀體驗,也始終是科學中最迷人的問題。在“我是誰”的終極追問下,當我們深入意識的機制與機理,會發現更值得深思的是,無論是神經機制的功能整合、信息的跨腦區傳遞,還是現象意識的主觀性質,不同層面的問題都在共同指向一個核心挑戰:物理過程如何產生主觀體驗?功能計算如何關聯現象感受?局部神經活動又如何整合為統一的意識?而要回答這些問題的并不簡單,它可能會挑戰我們對世界和實在,乃至科學方法本身的理解。
為了對意識問題進行系統探討,集智俱樂部聯合來自哲學、認知神經科學、計算機科學、復雜科學領域的研究者共同發起,跨越理論與實證、功能與現象、生物與人工的視角,全面深入研討意識這一現象本身。重點探討當代主流意識理論的核心主張與分歧,神經機制與主觀體驗之間的橋梁,以及AI意識、腦機接口等技術如何重塑人類意識主體的邊界與文明的未來。集智俱樂部榮幸邀請到IIT理論提出者、國際意識科學權威Giulio Tononi 教授在北京門頭溝區集智谷舉行深度對話。現讀書會已完結,現在報名可加入社群并解鎖回放視頻權限。
詳情請見:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.