![]()
2018 年,我曾在《深度學(xué)習(xí)》一書中,講述了人工智能從邏輯運(yùn)算模型向類腦計(jì)算模型轉(zhuǎn)變的歷程。回想 20 世紀(jì) 80 年代深度學(xué)習(xí)算法剛被發(fā)明時(shí),計(jì)算機(jī)性能僅及今日的百萬分之一。那時(shí)的我們無法預(yù)知,當(dāng)這些算法隨著規(guī)模擴(kuò)大和數(shù)據(jù)增加會(huì)具備怎樣的能力。
到 21 世紀(jì) 10 年代,深度學(xué)習(xí)在圖像識(shí)別、語音識(shí)別和語言翻譯等人工智能經(jīng)典難題上取得的突破令人震撼。更讓人驚嘆的是深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的完美結(jié)合。從 1992 年 TD-Gammon 在雙陸棋比賽中達(dá)到頂尖水平,到 2017 年 AlphaGo 擊敗圍棋世界冠軍,這一系列成就不禁讓我們思考:當(dāng)人工智能開始在人類擅長的領(lǐng)域勝出時(shí),這將給我們的未來帶來什么樣的影響?
自從 OpenAI 于 2022 年 11 月推出 ChatGPT 以來,大語言模型的突飛猛進(jìn)讓世界再次震驚。人們對(duì)它的反應(yīng)可謂喜憂參半:一方面為它能快速生成流暢文本而著迷,另一方面又擔(dān)憂它對(duì)就業(yè)前景和未來發(fā)展的影響。
語言作為人類最根本的能力,一直是我們判斷智力水平的關(guān)鍵標(biāo)準(zhǔn)。如今,人工智能的快速發(fā)展引發(fā)了一些人對(duì)超級(jí)智能突破的擔(dān)憂,認(rèn)為這可能危及人類的生存。比爾·蓋茨、埃隆·馬斯克乃至教皇方濟(jì)各等知名人士都對(duì)此發(fā)出警示。
一點(diǎn)是毋庸置疑的—盡管 ChatGPT 不是人類,但大語言模型在處理和提取海量文本數(shù)據(jù)方面已經(jīng)超越了人類的能力。這種仿佛來自異世界的“造訪”,在學(xué)界引發(fā)了一場(chǎng)爭(zhēng)議:大語言模型是否真正理解它們所產(chǎn)生的內(nèi)容?我們要如何驗(yàn)證一個(gè)系統(tǒng)是否真正具備理解能力?而對(duì)人類的理解過程本身,我們又了解多少?
![]()
![]()
你在考校大模型?其實(shí)它在反向“試探”你的智能
眾所周知,圖靈測(cè)試是檢驗(yàn)人工智能模擬人類反應(yīng)能力的經(jīng)典方法, 而目前有趣的一點(diǎn)是,在實(shí)際人與大語言模型交互過程中,大語言模型似乎在進(jìn)行一種更為微妙的反向圖靈測(cè)試 ,通過映射我們的反應(yīng)來檢驗(yàn)對(duì)話者的智能水平和提示質(zhì)量。這具體表現(xiàn)為:
對(duì)話者的思維水平越高,提供的提示越有深度,大語言模型就能展現(xiàn)出越高的智能表現(xiàn)。當(dāng)對(duì)話者表達(dá)強(qiáng)烈觀點(diǎn)時(shí),模型也會(huì)相應(yīng)地展現(xiàn)出更大的互動(dòng)熱情。
這種映射現(xiàn)象可以理解為啟動(dòng)效應(yīng)與語言能力的協(xié)同作用。這一現(xiàn)象并不能說明大語言模型具備與人類相同的智能或意識(shí),但確實(shí)展示了它在模仿人類個(gè)性特征方面的卓越能力。
大語言模型在映射用戶需求和智慧時(shí),可能就像《哈利·波特》中的厄里斯魔鏡 [Mirror of Erised(desire)的倒寫 ]。這面魔鏡“只能映照出觀看者內(nèi)心最深切、最渴望的愿望,僅此而已。然而,它既不能賦予知識(shí),也不能揭示真相。人們可能會(huì)在鏡前虛度光陰,或是被鏡中景象迷惑,甚至因無法分辨這些景象的真實(shí)性與可能性而陷入瘋狂。”
![]()
《哈利波特與魔法石》中的厄里斯魔鏡
通用人工智能一直是人工智能領(lǐng)域追求的終極目標(biāo)。有趣的是,這種通用能力正在大語言模型中逐步顯現(xiàn),但其實(shí)現(xiàn)形式與早期人工智能研究者的設(shè)想有所不同。大語言模型不僅展現(xiàn)出在各類語言任務(wù)中的多面性,還具備編程等跨領(lǐng)域能力。
特別值得注意的是,這些模型表現(xiàn)出了超乎預(yù)期的社交智能。鏡像假說為我們提供了一個(gè)全新的思考角度:通用智能是否首先源于人類的社交互動(dòng)能力,而語言能力是在進(jìn)化過程中發(fā)展出來的社交強(qiáng)化工具?這促使我們需要重新審視人類“通用智能”的本質(zhì)和起源。這種觀點(diǎn)可能會(huì)對(duì)我們理解智能的本質(zhì)帶來革命性的改變。
人類“智能”的標(biāo)準(zhǔn)該重寫了
2020 年 12 月 1 日,加州大學(xué)圣迭戈分校認(rèn)知科學(xué)系舉辦了一場(chǎng)主題為“ChatGPT 真的理解語言嗎?”的教師辯論會(huì),現(xiàn)場(chǎng)座無虛席。
反方辯手首先提出了“中文屋”的變體:一位哲學(xué)家在房間內(nèi),有人從門縫遞進(jìn)寫有中文的紙條,這位哲學(xué)家按照既定算法處理后將回應(yīng)遞回門外。那么,這位哲學(xué)家是否真正理解了中文?這個(gè)論證引發(fā)了諸多質(zhì)疑。
在辯論中,案例被改編為“匈牙利語屋”,哲學(xué)家則被替換為大語言模型,從而推論出大語言模型并不理解匈牙利語。然而,如果我們把“匈牙利語屋”換成“匈牙利大腦”,把哲學(xué)家換成物理定律,同樣的論證邏輯依然成立。至此,辯論的水平開始走低。
在我看來,這就像一杯水,反方認(rèn)為它是半空的,正方認(rèn)為它是半滿的,真相應(yīng)該介于兩者之間。在隨后的問答環(huán)節(jié)中,我提出語言學(xué)家普遍認(rèn)為語言的表達(dá)能力源于語法,而在語法生成能力方面,大語言模型實(shí)際上比多數(shù)人更為出色。對(duì)此,反方認(rèn)為語法問題并非核心所在。值得注意的是,隨著技術(shù)的不斷進(jìn)步,人們對(duì)人工智能的評(píng)判標(biāo)準(zhǔn)也在不斷提高。
關(guān)于大語言模型是否具有智能的討論,最終取決于我們?nèi)绾味x“智能”。
大語言模型 LaMDA 通過了阿爾卡斯設(shè)計(jì)的心智理論測(cè)試,而心智理論被認(rèn)為是自我意識(shí)的重要標(biāo)志之一。不過,也有不少人對(duì)此持謹(jǐn)慎懷疑態(tài)度。人類往往會(huì)低估其他動(dòng)物的智能,僅僅因?yàn)樗鼈儫o法與我們進(jìn)行語言交流。這種消極偏見恰好與另一種偏見形成呼應(yīng):我們傾向于對(duì)能與我們交談的個(gè)體產(chǎn)生積極偏見,即便它們的實(shí)際智能水平可能并不高。
這不禁讓人思考:我們是否具備足夠的智慧來判斷智能?大語言模型問世僅有短短數(shù)年,現(xiàn)在就推斷它們或其后代可能達(dá)到怎樣的智能水平還為時(shí)尚早。就像會(huì)說話的狗最令人稱奇的是它能說話這一點(diǎn)本身,而非它所說內(nèi)容的智慧程度或真實(shí)性。大語言模型即便在不夠準(zhǔn)確的情況下也會(huì)做出自信滿滿的回應(yīng)。如果我們將評(píng)判標(biāo)準(zhǔn)從理想化的人類轉(zhuǎn)向普通人,或許能得到更切實(shí)的比較結(jié)果。
專家們對(duì)大語言模型智能的認(rèn)知分歧,凸顯出我們基于自然智能的傳統(tǒng)認(rèn)知框架已難以適應(yīng)當(dāng)前形勢(shì)。大語言模型的出現(xiàn)為我們提供了一個(gè)重要契機(jī),促使我們突破固有思維模式,超越 19 世紀(jì)心理學(xué)遺留下來的過時(shí)概念。我們需要重新審視并深化對(duì)“智能”、“理解”、“倫理”以及“人工”等核心概念的認(rèn)識(shí)。
人類的智能顯然不僅限于語言能力;我們可能在某些領(lǐng)域與大語言模型擁有共同的智能特征,但在其他方面則存在本質(zhì)差異。以創(chuàng)造力為例,它是自然智能的典型特征,而大語言模型也確實(shí)展現(xiàn)出了創(chuàng)造性思維的潛質(zhì)。在實(shí)際對(duì)話中,如果否認(rèn)大語言模型具備理解人類意圖的能力,那么它生成的許多文本內(nèi)容就難以得到合理解釋。這使我們必須對(duì)“意圖”這一概念進(jìn)行更深入的探討。這一概念源自心智理論,而心智理論本身也值得我們進(jìn)行更細(xì)致的研究和重新思考。
問題的關(guān)鍵在于,對(duì)于大腦這樣一個(gè)復(fù)雜系統(tǒng),存在著無數(shù)相互作用的神經(jīng)元和內(nèi)部狀態(tài),不同的實(shí)驗(yàn)探測(cè)了不同的大腦區(qū)域,實(shí)際上每個(gè)實(shí)驗(yàn)研究的都是不同類型的“注意力”。對(duì)于大腦這樣的復(fù)雜動(dòng)力系統(tǒng),很難用“注意力”和“意識(shí)”這樣的概念來進(jìn)行準(zhǔn)確定義。
語言賦予人類獨(dú)特能力,但詞語本身具有不穩(wěn)定性,這種不穩(wěn)定性恰恰是它們力量的源泉。因此,我們需要更堅(jiān)實(shí)的基礎(chǔ)來構(gòu)建新的概念框架。
我們正處在一個(gè)前所未有的歷史機(jī)遇期,這與 17 世紀(jì)物理學(xué)變革時(shí)期極為相似。當(dāng)時(shí),“力”、“質(zhì)量”和“能量”等概念經(jīng)過數(shù)學(xué)形式化處理,從模糊的術(shù)語轉(zhuǎn)變?yōu)榫_的可測(cè)量指標(biāo),由此奠定了現(xiàn)代物理學(xué)的基礎(chǔ)。在研究大語言模型的過程中,我們很可能會(huì)發(fā)現(xiàn)關(guān)于智能本質(zhì)的新原理,就像 20 世紀(jì)物理學(xué)家揭示物理世界的基本原理一樣。正如量子力學(xué)在首次提出時(shí)違背人們的直覺認(rèn)知一樣,當(dāng)智能的基本原理被揭示時(shí),可能也會(huì)呈現(xiàn)出違反常理的特性。
自然是否在高度進(jìn)化的靈長類大腦中實(shí)現(xiàn)了一個(gè)類似于大語言模型的系統(tǒng)?通過研究大語言模型展現(xiàn)的語言處理能力,我們可能會(huì)發(fā)現(xiàn)一些關(guān)于語言智能的基本原理,這些原理或許能夠推廣到社會(huì)智能、機(jī)械智能等其他智能形式。與生物進(jìn)化相比,大語言模型的發(fā)展速度要快得多。一旦相關(guān)技術(shù)基礎(chǔ)確立,其性能就會(huì)在持續(xù)改進(jìn)中不斷提升。
這項(xiàng)技術(shù)最為突出的特點(diǎn)在于:在探索其發(fā)展的過程中,我們可能會(huì)深入理解人類智能的本質(zhì)。
那么,在這樣的理念下,我們具體是怎么做的呢?
“我演算故我在”:AI的新本體論
“我思故我在”是笛卡兒哲學(xué)的核心命題。這句話常被譯為“我思考,所以我存在”,但更精確的翻譯可能是“我正在思考,因此,我必定存在”,或簡(jiǎn)言之,“思考即存在”。
“思維”是一個(gè)難以準(zhǔn)確界定的模糊概念。對(duì)某些人而言,思維是一連串的邏輯推理;對(duì)另一些人來說,它更像是念頭的流動(dòng);而對(duì)許多人而言,它是漂浮在“感受之海”中的內(nèi)心對(duì)話。但這些描述終究只是文字游戲。若要判斷大語言模型在回答問題、創(chuàng)作詩歌或解決數(shù)學(xué)問題時(shí)是否真的在思考,我們需要對(duì)思維下一個(gè)明確的定義。然而,僅僅通過分析行為表現(xiàn),恐怕還不足以解答這個(gè)根本性問題。
我曾在普林斯頓大學(xué)修過一門研究生哲學(xué)課程,整個(gè)學(xué)期都在探討一個(gè)問題:“語言和思維,孰先孰后?”雖然進(jìn)行了一個(gè)學(xué)期的深入討論,我們卻始終無法得出確定結(jié)論。對(duì)這個(gè)問題,主要存在兩種觀點(diǎn)。
語言先于思維(語言決定論):這一觀點(diǎn)主要基于薩丕爾 - 沃爾夫假說,認(rèn)為人類的思維和行為深受所使用語言的影響。在其強(qiáng)式表述中,該假說甚至認(rèn)為語言完全決定思維:我們只能在語言允許的框架內(nèi)思考。
思維先于語言(思維優(yōu)先論):這種觀點(diǎn)認(rèn)為思維獨(dú)立于語言而存在。支持者認(rèn)為,人們?cè)谡莆毡磉_(dá)語言之前就已經(jīng)有了思維和想法。這種觀點(diǎn)經(jīng)常得到認(rèn)知心理學(xué)和神經(jīng)語言學(xué)的支持。我們可以從兒童在獲得語言能力之前就能思考和解決問題,以及動(dòng)物的認(rèn)知能力等證據(jù)中看到這一點(diǎn)。
大多數(shù)學(xué)者認(rèn)為語言與思維的關(guān)系并非單向決定,而是在復(fù)雜的互動(dòng)過程中相互影響、彼此塑造。一方面,我們固然需要語言來交流和表達(dá)思想;另一方面,人類的認(rèn)知能力也在不斷影響語言的演化與發(fā)展。
進(jìn)一步,思維本身具有多樣性,并非所有思維活動(dòng)都依賴語言。比如,視覺思維、空間思維和情感思維等形式的思維過程,往往可以不依靠語言就能完成。
思維作為一個(gè)認(rèn)知過程,一直是哲學(xué)家們探討的重要議題。它涉及在心智層面對(duì)信息的處理,包括概念形成、問題解決、決策制定和反思等活動(dòng)。思維活動(dòng)的范圍極其廣泛,從簡(jiǎn)單(如記憶一串電話號(hào)碼)到復(fù)雜(如設(shè)計(jì)精密機(jī)械),再到案例 GPT 5.2 中提到的眾多認(rèn)知活動(dòng)。
2023 年,著名語言學(xué)家諾姆·喬姆斯基就大語言模型無法實(shí)現(xiàn)人類真實(shí)思維的問題,提出了一個(gè)深刻的見解。
他通過一個(gè)簡(jiǎn)單的物理現(xiàn)象進(jìn)行了闡釋。當(dāng)我們手持蘋果并松手時(shí),會(huì)產(chǎn)生三個(gè)層次的認(rèn)知:第一層是現(xiàn)象描述—“蘋果掉下來了”;第二層是預(yù)測(cè)推斷—“如果松手,蘋果必然下落”。這兩種認(rèn)知雖然都有其價(jià)值和準(zhǔn)確性,但還不構(gòu)成真正的思維活動(dòng)。真正的思維在于第三層:因果解釋。它不僅包含對(duì)現(xiàn)象的描述和預(yù)測(cè),更涉及普遍性的反事實(shí)推理(“一切類似物體都會(huì)下落”),以及本質(zhì)性的原因分析(“基于重力作用”或“源于時(shí)空曲率”)。用反事實(shí)條件來表述就是:“若無重力作用,則蘋果不會(huì)下落。”這種融合了觀察、推理和本質(zhì)認(rèn)知的過程,才是人類獨(dú)特的思維方式。
這段對(duì)思維某些特征的描述清晰而有說服力。不過,我們應(yīng)當(dāng)通過實(shí)驗(yàn)數(shù)據(jù)來檢驗(yàn)這一批判性觀點(diǎn)。事實(shí)上,正如案例 GPT 5.3的研究結(jié)果顯示,ChatGPT 已經(jīng)能成功應(yīng)對(duì)喬姆斯基提出的思維測(cè)試。然而,無論如何定義思維,僅憑語言都難以對(duì)其進(jìn)行完整描述。考慮到思維研究的重要性,這一領(lǐng)域顯然不應(yīng)僅局限于語言學(xué)的視角。
當(dāng)前關(guān)于大語言模型是否真正“理解”其輸出內(nèi)容的爭(zhēng)論,讓我聯(lián)想到一個(gè)世紀(jì)前關(guān)于“生命本質(zhì)”的討論:生命體與非生命物質(zhì)的本質(zhì)區(qū)別是什么?當(dāng)時(shí)的生命力論者認(rèn)為,生命依賴于一種無形的“生命力”,這種力量存在于生物體內(nèi)而非無生命物質(zhì)中。然而,這種抽象的辯論并未推動(dòng)科學(xué)進(jìn)步。直到 DNA(脫氧核糖核酸)雙螺旋結(jié)構(gòu)的發(fā)現(xiàn),才帶來了生物學(xué)的革命性突破。
如今圍繞“智能”和“理解”的爭(zhēng)論,與當(dāng)年關(guān)于“生命”的辯論何其相似。AGI 這一概念,某種程度上就像昔日的“生命力”說。可以預(yù)見,機(jī)器學(xué)習(xí)的進(jìn)步最終可能會(huì)催生一個(gè)全新的概念框架,就像 DNA 結(jié)構(gòu)之于生物學(xué)一樣,為人工智能領(lǐng)域帶來根本性的突破,現(xiàn)在是重新審視舊有概念的最佳時(shí)機(jī)。
文/特倫斯·謝諾夫斯基 摘自新書《大語言模型》,2025.7
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.