![]()
![]()
英文“Intelligence”在詞典中有兩個核心定義:一是人類獲取和應用知識的技巧與能力;二是情報,最初指軍事情報,后來擴展到經(jīng)濟情報和社會情報。我認為,這兩個定義必須結合考慮。情報的本質是KAO:Knowledge(知識)、Action(行動)和Organization(組織)。未來的智能也應如此,不應僅是簡單算法,應是以KAO形式開展,有知識,有組織,有行動。
![]()
2016年6月5日,墨子沙龍邀請到王飛躍教授在中國科學技術大學上海研究院作主題為《智能的本源——歷史與展望》的講座。本文根據(jù)報告整理而成。
1
第一部分
追溯“智能”歷史,從古希臘到達特茅斯
今年(注:講座舉辦于2016年)是達特茅斯會議(Dartmouth Conference)召開60周年,許多人以此作為人工智能“誕生”的標志,將其視為智能歷史的起點。其實人類智能的起源遠早于此,從猴子時代開始,我們就已具備基本的智能形式,怎么能說只有60年呢?
![]()
▲坐落于美國新罕布什爾州漢諾威小城的達特茅斯會議舊址,來源:清華大學
達特茅斯會議于1956年順利召開,其最大功臣是約翰·麥卡錫(John McCarthy)。作為Lisp語言[1]的創(chuàng)始人,麥卡錫畢業(yè)于普林斯頓大學數(shù)學系,與“人工智能之父”馬文·明斯基(Marvin Lee Minsky)是同系校友。畢業(yè)后,他前往達特茅斯學院任教。早在1955年,麥卡錫就萌生了創(chuàng)建人工智能領域的想法,他創(chuàng)造了“Artificial Intelligence”(人工智能)這一術語,并向洛克菲勒基金會寫信申請經(jīng)費,提出舉辦人工智能的研討會。最終,他們獲得了資助,會議吸引了十幾位專家參加。
在我看來,麥卡錫雖是發(fā)起者,但最大貢獻者是明斯基。人工智能的三大主要學派[2]中,有兩個是由明斯基創(chuàng)立的:符號主義和連接主義。明斯基是最早在博士論文中提出隨機神經(jīng)元網(wǎng)絡的人。此外,明斯基還是認知科學家,而非單純的人工智能專家。
![]()
▲年輕時的馬文·明斯基,來源:百度百科
回顧人工智能的古代和近代史,其實可以追溯到三位關鍵人物:亞里士多德、萊布尼茨,以及集大成者的喬治·布爾(George Boole)。
亞里士多德是第一個將邏輯形式化的人。他的形式邏輯奠定了符號主義的基礎,三段論[3](syllogism)就是其核心貢獻。萊布尼茨(Gottfried Wilhelm Leibniz)的影響同樣深遠。他發(fā)表微積分論文早于牛頓,當今微積分符號大多源于萊布尼茨。他還研究了“推理微積分”(calculus ratiocinator),旨在將思維模式化,這與我們今天計算機處理邏輯的方式一脈相承。更重要的是,二進制系統(tǒng)也是萊布尼茨發(fā)明的。
布爾創(chuàng)立了邏輯代數(shù),即布爾代數(shù),這是現(xiàn)代計算機、邏輯電路和電路設計的基礎。隨后,查爾斯·巴貝奇(Charles Babbage)設計并制作了第一臺差分機和分析機[4],這些機械計算設備預示了計算機的雛形。接著,諾伯特·維納(Norbert Wiener)創(chuàng)立了控制論(Cybernetics),將反饋機制引入系統(tǒng)科學。這些發(fā)展串聯(lián)起人工智能的近代基礎。
![]()
▲巴貝奇差分機2號互動模型,來源:清華大學科學博物館
人工智能并非孤立出現(xiàn),而是哲學、數(shù)學和工程的交匯。達特茅斯會議只是一個起點,它激發(fā)了后續(xù)的符號主義、連接主義和控制論等學派。從亞里士多德的邏輯形式化,到萊布尼茨的二進制和推理系統(tǒng),再到布爾的代數(shù)邏輯,以及巴貝奇的機械計算和維納的反饋理論,這些先驅共同鑄就了人工智能的根基。
2
第二部分
蘇格拉底、圖靈與明斯基,古今學者的“智能觀”
回溯智能的本質,英文“Intelligence”在詞典中有兩個核心定義:一是人類獲取和應用知識的技巧與能力;二是情報,最初指軍事情報,后來擴展到經(jīng)濟情報和社會情報。我認為,這兩個定義必須結合考慮。正如陰陽互補——陽為智能,陰為情報,沒有情報的智能如同盲人。谷歌和百度等正是基于此起家,它們從搜索引擎起步,擅長情報收集和處理。情報的本質是KAO:Knowledge(知識)、Action(行動)和Organization(組織)。未來的智能也應如此,不應僅是簡單算法,應是以KAO形式開展,有知識,有組織,有行動。
![]()
▲單詞“intelligence”在劍橋英語詞典中的解釋
不同科學家對智能的理解不同。西方哲學家蘇格拉底持極端觀點:“我知道我一無所知。”他認為無知是人類進步的動力,如果人類無所不知,我們的存在理由將消失。另一極端是愛因斯坦,他強調智能不止于知識,更需想象力:“想象力比知識更重要。”我個人認為,最靠譜的是約翰·馮·諾伊曼(John von Neumann)的觀點。今天的社會印證了他的預言:知識的積累和應用是一個過程,隨著人口的增加、積累的知識的增加,會有一個爆炸式的增長。現(xiàn)在的社會并非智能奇點,而是智能爆炸。
馬文·明斯基是人工智能的真正思想家。他不相信智能有單一原理:“是什么不可思議的訣竅讓我們變得智能?訣竅就是沒有訣竅。智能的力量源于我們自身的巨大多樣性,而非任何單個完美的原理。”我認同這一觀點,也相信哥德爾不完備定理[5](G?del's Incompleteness Theorems)和圖靈不可判定性[6](Turing's Halting Problem)。這些定理揭示了有限與無限的本質矛盾:人類有限的生命試圖理解無限宇宙,自然會存在這種矛盾。因此,我堅決不相信人工智能會“取代人類”。
艾倫·圖靈(Alan Turing)的論文《論可計算數(shù)及其在判定問題上的應用》(On Computable Numbers, with an Application to the Entscheidungsproblem, 1936)定義了丘奇-圖靈論題(Church-Turing Thesis):所有可計算函數(shù)均可由圖靈機計算。這奠定了通用計算機的基礎。他還在哲學雜志上發(fā)表《計算機器與智能》(Computing Machinery and Intelligence, 1950),提出圖靈測試(Turing Test),評估機器是否具備人類智能。
![]()
▲艾倫·圖靈(Alan Turing),來源:騰訊新聞
早期人工智能深受邏輯理論家影響,赫伯特·西蒙(Herbert Simon)和艾倫·紐厄爾(Allen Newell)開發(fā)的人工智能程序GPS(General Problem Solver),旨在模擬人類解決一般性問題的思維過程,是一個通用推理工具,這受到了羅素和懷特海的《數(shù)學原理》(Principia Mathematica)啟發(fā)。西蒙曾預測:到1968年,數(shù)字計算機將贏得國際象棋冠軍;十年后,又預言到1985年,電腦能完成男人的所有工作。這些預測雖未全實現(xiàn),但已預見到人工智能領域的未來發(fā)展。
1996年,IBM開發(fā)國際象棋計算機深藍,2016年,谷歌DeepMind開發(fā)圍棋AI——AlphaGo。深藍在1997年擊敗卡斯帕羅夫,AlphaGo在2016年擊敗李世石,這些都是AI史上的標志性事件。二者天差地別。深藍是應用數(shù)學的巔峰:其計算路徑透明,所有人都能追蹤;AlphaGo則基于深度學習,其神經(jīng)網(wǎng)絡提取特征的過程黑箱化——連設計者也不知道提取了什么特征,這些特征又形成了怎樣的特征空間。這正是智能的重要特征:無人知曉。如果一切透明,就不是智能,而是邏輯數(shù)學。最初,大家懷疑AlphaGo,因為它無法解釋特征,但實踐證明了深度學習在圖像識別上的效用:機器翻譯從低精度躍升,同聲翻譯和網(wǎng)絡翻譯的可用性,正是深度學習的成果。
然而,深度學習有自身局限。杰弗里·辛頓(Geoffrey Hinton)曾說:“如果你只有一個問題要解決,用神經(jīng)網(wǎng)絡就好。但若想從事科學、理解架構選擇或遷移到新問題,你必須明白不同架構的能與不能。”
![]()
▲杰弗里·辛頓(Geoffrey Hinton)在2025世界人工智能大會上發(fā)言,來源:世界人工智能大會
3
第三部分
那些不為人知的“至暗時刻”
我們常說,人工智能只有酷暑和寒冬,卻沒有春天與秋天。發(fā)展至今,人工智能經(jīng)歷了至少九次“冬天”,即資金和興趣銳減期。第一個冬天源于翻譯失敗。20世紀50年代,IBM開發(fā)喬治城翻譯機器。宣稱“電子大腦翻譯俄語”,“雙語機器”。然而,實際的演示只是將一套精心挑選的49個俄語句子翻譯成英語,機器的詞匯量僅限于250個單詞。“The spirit is willing but the flesh is weak”(心有余而力不足,flesh指肉體)。早期機器翻譯成俄文后,反譯回英文,變成了:“伏特加酒是好的,可惜肉是爛的”(酒香而肉臭)。這導致1950年代末的翻譯項目崩盤。
第二冬由明斯基和西摩·帕佩特(Seymour Papert)引發(fā)。他們在論文《感知機》(Perceptron, 1969)中,用單層神經(jīng)元網(wǎng)絡無法解決XOR問題(異或門),擴展結論批評整個領域,向美國軍方報告不負責任言論,導致經(jīng)費中斷,十年無人觸及神經(jīng)網(wǎng)絡。雖然后來他們澄清未否定感知機[7]的價值,但白紙黑字已造成了損害。直到1986年,并行分布式處理小組推出反向傳播算法,神經(jīng)網(wǎng)絡復蘇,才催生了今日的深度學習。
第三個冬天源于英國的Lighthill報告(1973),報告對人工智能的發(fā)展現(xiàn)狀進行了評估,認為人工智能研究人員夸大了他們的承諾,發(fā)展人工智能技術是錯誤且徒勞的,這直接導致英國資助停止。隨后是Lisp機器熱潮和日本第五代計算機計劃(1980s)。我親歷了這個浪潮,它對邏輯編程(Logic Programming)投入甚多。日本宣稱投入巨資開發(fā)基于邏輯的計算機,但最終不了了之。我讀過多本邏輯編程書籍,羅伯特·科瓦爾斯基(Robert Kowalski)的《邏輯作為萬能鑰匙》(Logic for Problem Solving)最佳。辛頓參與了神經(jīng)網(wǎng)絡的“第一次復活”,如今仍是深度學習領軍人物。杰夫·霍金斯(Jeff Hawkins)的《論智能》(On Intelligence)也影響深遠。
![]()
▲《Logic for Problem Solving》,來源:豆瓣
一次又一次冬天體現(xiàn)出人工智能發(fā)展的周期性,但每次復蘇都會帶來新的技術進步,比如符號主義、連接主義和深度學習。
如何實現(xiàn)真正的智能?當前多數(shù)AI是封閉的,局限于預設數(shù)據(jù)庫。人腦的智能則是開放的:面對問題,人的思維瞬間擴散,激活腦海中過去歷史、生活、知識和經(jīng)歷,整個大腦網(wǎng)絡都會蘇醒。人工智能現(xiàn)有的算法僅能激活內部知識庫,如何擴展?還需要云計算、物聯(lián)網(wǎng)和大數(shù)據(jù)等提供途徑,促進從封閉智能轉向開放智能。
生命的本源是獲取知識、面對未知;智能的本源是利用已知解決未知。這將引領第五個時代:工業(yè)5.0。從第一代蒸汽機機械化、第二代電動機電氣化、第三代計算機信息化、第四代路由器網(wǎng)絡化,到第五代平行化(Parallelization),未來,大量人類將構建軟件定義的系統(tǒng):軟件定義的你、我、房間、家庭、過程和產(chǎn)品。智能社會需要軟件定義的一切(Software Defined Anything,),也將催生新行業(yè):決策師、評估師、學習師、游戲工程師等。機器人也將平行化:物理機器與軟件定義機器融合。
AlphaGo最神奇之處,就是海量計算中擊敗人類。我提出從丘奇-圖靈論題轉向AlphaGo論題(AlphaGo Thesis)。丘奇-圖靈論題是一個猜想:所有可計算者均由圖靈機計算,奠定計算機基礎。AlphaGo論題則指出,復雜性問題可轉化為可解形式。AlphaGo式結構不提供新算法,但劃定范圍后,AI可達到或超過人類水平。
![]()
▲李世石與AlphaGo人機大戰(zhàn),來源:百度百科
當今世界,90后、00后成長于碎片化、離散信息中。而智能產(chǎn)業(yè)需要深度知識,二者之間鴻溝巨大。因此,必須靠知識自動化、AI、機器人來彌補。經(jīng)濟學家西蒙曾憑有限理性(Bounded Rationality[8])獲諾貝爾獎,有限智能也是有限理性。未來,智能將從固定知識轉向流動智能,實現(xiàn)知識數(shù)字化、動態(tài)化和實時化。
注釋
[1] Lisp語言誕生于 1958 年,由美國計算機科學家約翰?麥卡錫(John McCarthy)在麻省理工學院(MIT)主導設計,既是最早的函數(shù)式編程語言,也是首個專注于符號處理的語言。從誕生至今,Lisp 雖未成為大眾主流語言,卻在人工智能(AI)、計算機科學教育、自動化工具開發(fā)等領域持續(xù)發(fā)揮核心作用,其 “代碼即數(shù)據(jù)、數(shù)據(jù)即代碼” 的設計哲學,更是深刻影響了后續(xù)編程語言(如 Python、JavaScript、Haskell)的發(fā)展。
[2] 人工智能的研究可以劃分為三大學派:符號主義、連接主義和行為主義。符號主義學派認為人工智能源于數(shù)學邏輯,其原理主要為物理符號系統(tǒng)(即符號操作系統(tǒng))假設和有限合理性原理。這一學派通過邏輯推理和符號操作來模擬人類的智能行為。例如,早期的專家系統(tǒng)就是基于符號主義的思想開發(fā)的。連接主義學派認為人工智能應該通過模擬人腦中的神經(jīng)網(wǎng)絡來實現(xiàn)。這一學派的研究重點是神經(jīng)網(wǎng)絡的結構、學習算法和應用。隨著深度學習技術的興起,連接主義學派在圖像識別、語音識別等領域取得了顯著成果。
行為主義學派認為人工智能應該通過感知和行動來實現(xiàn)智能行為。這一學派的研究重點是機器人的感知、行動和學習能力。行為主義學派的研究成果在智能機器人、自動駕駛等領域得到了廣泛應用。
[3] 三段論:公元前4世紀,亞里士多德在《工具論》中首次提出三段論的完整模型,將其定義為“由三個命題組成的推理結構”(包含大前提、小前提和結論),并確立其為邏輯學的基石。
[4] 世界第一臺差分機(1822年)和分析機(1834年)由巴貝奇設計。差分機計算精度達6位小數(shù)、可處理3個不同5位數(shù);分析機能用多項式展開的方法計算對數(shù)和三角函數(shù),它們是計算機的雛形,為現(xiàn)代計算機和人工智能的算法與硬件基礎提供了關鍵思想原型。
[5] 哥德爾不完備定理(1931年)指出,在任何足夠強的數(shù)學系統(tǒng)中,總存在既不能被證明也不能被證偽的命題,揭示了數(shù)學的局限性。
[6] 圖靈不可判定性(1936年)證明,不存在一個通用算法能判斷任意程序是否會停止運行,這是計算理論的基礎,也影響了人工智能的邊界。
[7] 感知機(Perceptron)由康奈爾大學心理學家弗蘭克·羅森布拉特于1958年提出。作為首個模擬人類思維的實驗性機器,感知機由美國海軍資助,具備400個光傳感器模擬視網(wǎng)膜,連接約1000個神經(jīng)元進行信息處理,并輸出單一結果。羅森布拉特將其定位為“首個類似人腦思維的機器”。
[8] 有限理性模型(Bounded Rationality Model),又稱西蒙模型,由美國經(jīng)濟學家赫伯特·西蒙于20世紀50年代提出。該模型突破傳統(tǒng)經(jīng)濟學“完全理性人”假設,主張用“社會人”取代“經(jīng)濟人”,認為決策者因信息獲取能力、計算能力和認知能力的限制,只能在有限范圍內做出理性選擇。
文字整理:詩學
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.