網易首頁 > 網易號 > 正文申請入駐

AGI for Science：關于科學未來的6個問題

2025-09-29 11:03:11　來源: 知識分子

北京舉報

分享至

上海人工智能實驗室主任、首席科學家周伯文在浦江創新論壇

撰文｜周伯文

人工智能（AI）正在重新定義科學研究的邊界。它在科學領域的應用，正在引發一場前所未有的革命，不僅挑戰著我們對科學問題的理解，還可能重塑未來的知識邊界。

9月21日下午，在上海舉行的2025浦江創新論壇（第十八屆）人工智能賦能科學研究專題論壇上，上海人工智能實驗室主任、首席科學家周伯文教授提出《AGI for Science之六問》，提出了幾個關鍵性問題：AI真的能突破一切科學難題嗎？AI的預測能力是否全面超越現有計算方法？它能超越人類的認知極限，開辟出全新的科學疆域嗎？

在他看來，“人們總是高估技術的短期變化，卻低估其長期變革”。當前 AI 在通用問題求解和替代傳統預測方法等方面可能被高估，但其在促進學科交叉融合、催生新科學領域以及協助人類推導和驗證重大理論創新等方面的深遠潛力卻往往被低估。

“AI 正在加速拓展知識邊界，但科學探索的羅盤始終是人類的心靈、好奇心與價值觀來指引”，周伯文提出：“把握被高估的當下，投身被低估的未來。預測未來最好的方法就是創造未來！”

以下為演講全文：

各位來賓下午好！AI能力的飛速躍升，使得我們今天所討論的話題，已經從 AI for Science，跨越到 AGI for Science 階段。對戰略性問題的探索與思考，是我長期關注的課題，因此也想借此報告，與大家分享關于這個領域的一些根本性問題。

當一個領域變得炙手可熱時，我們往往會想起一句老話：人們總是高估一項技術的短期影響，導致出現泡沫；但從長遠來看，卻又容易低估其革命性的潛力——這就是“阿瑪拉定律”（Amara’s Law）。在 AGI for Science 領域里，是否也正陷入同樣的認知偏差：對其短期變化高估，而對其長期變革影響低估？

我提出這些問題的初衷，是希望幫助年輕的研究者們更好地辨別，哪些科學問題值得從更長遠的角度深入思考。

01 第一問邊界之問：所有科學問題是否都能被人工智能解決？

我的第一個問題是：科學智能的邊界在哪里？

AI for Science 的能力范圍究竟有多大？什么是 AI 能夠解決的科學問題，什么又是它不能解決的？如果我們對這一點缺乏清晰的認知，就很容易陷入“AI 萬能”的誤區。

這并非一個新問題。盡管 AI for Science 是一個新興的技術領域，但類似的思辨早在百年前的數學界就已展開。當計算尚處于萌芽階段時，數學家們就激烈爭論，所有數學命題是否都能通過機械化方式解決。其中，大衛·希爾伯特和威廉·阿克曼提出的“數學可判定性問題（Entscheidungsproblem）”尤為著名：是否存在一種通用方法，能夠在有限步驟內判定任意數學陳述的真假？然而，“哥德爾不完備定理”的出現，基本否定了這種可能性。十年后，計算機科學理論的重要奠基人阿隆佐·丘奇和艾倫·圖靈從算法層面進一步證明，此種通用算法并不存在。讓解決這一問題陷入“幻滅”。

有意思的是，吳文俊先生在上世紀70年代，開創了機器證明（或稱“數學機械化”）這一領域，他創立的方法后被國際稱為“吳方法”。以他名字命名的獎項被譽為“中國智能科技最高獎”。他將幾何定理的證明轉化為代數方程的處理。通過一系列高度創新的數學轉化（如“三角化”），將復雜的幾何關系表示為多項式方程，然后通過符號計算來判定定理是否成立。吳文俊先生證明了，初等幾何以及一大類微分幾何定理的證明可以完全機械化。這意味著，對于這些領域的定理，存在一個統一的算法，能夠判斷其真偽，在特定領域實現了這個夢想。

這段歷史告訴我們，從大膽假設、到被證偽、再到新的突破，期間曲折的過程恰恰是科學發展的魅力所在。

今天我們面對 AI for Science，亦應懷抱同樣的思考：在大家紛紛投身這一領域的同時，是否認真追問過它的能力邊界？“邊界之問”可視為“AI for Science 的希爾伯特之問”。如果我們認同這是一個根本性問題，那么“AI for Science 的哥德爾定理”在哪？誰將成為破解這一難題的“圖靈”和“丘奇”？誰又能提出屬于我們這個時代的“吳方法”？

這是一個激動人心的時代，每一個問題都值得深入研究和討論。

02 第二問預測之問：AI的預測能力是否全面超越現有計算方法

第二個問題，我稱之為“預測之問”。

什么是科學？科學的關鍵特征之一是，能否準確預測系統將要發生什么。但我們不應高估當前的大語言模型或數據驅動方法，認為它們能準確預測一切科學現象。以諾貝爾獎成果AlphaFold為例，它能夠精確預測蛋白質三維結構，但我們仍難以通過模型深入理解蛋白質的折疊機制——預測的準確性并未帶來認知上的新突破。

同樣，對于復雜系統如三體問題，神經網絡難以精準預測其長期的混沌行為。關鍵在于，當前的大模型訓練方法仍受限于人類已有認知，我們“喂”給模型的數據本身已被人為約束。若不能突破原有認知框架，則僅依賴大模型難以真正精準揭示科學規律。

如何應對這一問題？在今年的世界人工智能大會上，我們將早先提出的“通專融合” AGI技術路徑進一步細化為SAGE（Synergistic Architecture for Generalized Expertise，中文含義為“智者”），強調在基礎模型、融合協同和探索進化等多個層面，融入物理世界的真實規律。在物理、歷史與物質研究中，初始條件、邊界約束與對稱性等應作為人工智能求解空間的重要約束。

03 第三問語言之問：對于科學表征，如何超越自然語言？

第三個問題是“語言之問”：我們如何超越自然語言，實現對科學更有效的表征？

自然語言是人類智能的極致體現、智慧的濃縮。當前的大型語言模型，本質上正是對人類自然語言的壓縮模型，并由此催生了令人矚目的智能涌現現象。然而，根本性問題在于：繼續向前推進，自然語言是否足以表征所有的科學現象？

我認為答案很可能是否定的。這一點可以追溯到荷蘭計算機科學家、1972 年圖靈獎得主埃德斯加·迪杰斯特拉（Edsger Dijkstra）很早前提出的觀點：他對使用自然語言進行編程持懷疑態度。當然，以今天的 AI 技術來看，自然語言編程已不再是不可逾越的障礙——AI 在理解和生成代碼方面表現越來越強。最近的突破表明，AI 編程能力已在奧林匹克競賽中匹敵人類。

但迪杰斯特拉思想的深刻之處在于，他揭示了為什么自然語言本身是不夠的。他指出，古希臘數學長期依賴口頭表達與圖形輔助，導致思維發展在一定階段陷入停滯，直至符號系統的引入才帶來轉機；阿拉伯“代數”在采用阿拉伯數字后一度蓬勃發展，但在回歸修辭導向的表達方式后，發展再度減緩；而現代科學文明能夠在歐洲迅速傳播與深化，很大程度上得益于韋達、笛卡爾、萊布尼茨等學者所推動的數學形式化革命——正是通過建立嚴謹符號體系并引入精確的數學符號，才實現了對科學知識的清晰、系統且可推演的表征。

這引發了更深層的思考：科學所描述的物理世界早在人類誕生之前就已存在，科學自有其內在的規律，我們如何能夠假定自然語言，且不說涵蓋所有科學內容，足以完全捕捉自然界的本質行為？從表達的角度來看，自然語言的誕生遠遠晚于世界本質的誕生，它是否能夠精確表征自然界的運行方式？我認為答案是否定的。

其次，從理解方式來看，自然語言無疑有助于人類理解和傳播科學知識，我們的教科書、師徒傳授都依賴自然語言。但這種理解是否最精確？是否足以支撐人工智能實現更好的泛化？精確的科學規律是否一定能以被人類直觀理解的方式呈現？我認為答案也大概率也是否定的。

正因如此，我認為，未來的“AI for Science”應當邁向“AGI for Science”，這不僅意味著能力需從狹義 AI 提升至AGI（通用人工智能），也意味著我們需要從純粹依賴自然語言，走向自然語言與符號語言等多種表示形式的融合。如果我們對“AI for Science”懷有期待，那么更應寄望于“AGI for Science”。

因此，我們主張探索自然語言與形式化語言的結合。自然語言可視為人類對物理世界觀察的主觀投影，而形式化語言則可能更貼近自然世界最本質、最底層的規律。

所以，目前上海人工智能實驗室也正基于自然語言與多模態表征，進一步開展對多尺度、多來源、異構數據的統一數字表征研究，其中的重點為加強形式化表征方法的探索與融合。

04 第四問交叉之問：AGI for Science 不只在于AI與其他學科交叉，還能帶來新的融合？

第四個問題是“交叉之問”。

關于交叉的問題，我特別想與在座各位自然科學與社會科學研究者分享。

當我們談論 AI for Science 時，是在談論什么？很多研究者可能首先會想到，如何將人工智能應用于自己的學科中——這當然極具潛力。但我想強調的是，AI for Science 最具魅力的地方，遠不止于 AI 對單一學科的賦能，更在于它如何促進不同學科之間的深度融合，激發出新的交叉學科與多學科激勵效應。不同科學領域能契合在一起這點并不明顯，但考慮到自然界的底層結構，存在共通性也并不令人驚訝。要識別不同領域之間的共通之處，可以期待人工智能提供幫助，一旦了解了某個領域的模式，就可以期待發現另一個領域的對應關系。這才是 AGI for Science 所能帶來的核心價值：它應不斷啟發、誘導乃至催生全新的學科方向——這正是充分發揮能力的關鍵所在。

歷史上這樣的例子并不少見。比如，沃倫·韋弗（Warren Weaver）在二十世紀三十年代就敏銳地意識到，生物學的未來在于與物理學、化學和數學的交叉融合。他將這一趨勢稱為“一股尚未積蓄力量的新浪潮”。從 1933 年起，他將洛克菲勒基金會年度預算的 80% 投入交叉科學研究。短短5年后，該領域已涌現大量原創突破。1938 年，這一新興領域正式命名為“分子生物學”。此后數十年間，這一認知指引了分子生物學領域多項革命性進展，為發現DNA 雙螺旋結構、現代遺傳、生物技術等奠定了基石。

在當時，學科交叉仍依賴于個別人物的遠見與某家機構的大力推動。但在今天的 AGI 時代，我們完全有可能借助通用人工智能，更系統、更高效地實現學科間的融合與洞察，而不再僅僅依賴“個人英雄式”的發現。這正是 AGI for Science 在“交叉之問”上的根本使命：其核心價值不在于 AI 與某一學科的簡單結合，而在于 AI 成為多學科交叉融合的催化劑與加速器——這將幫助我們看見人類尚未看見的聯系，構建人類尚未構建的科學范式。

上海人工智能實驗室于今年初啟動了“AI4S攀登者行動計劃”，其核心目標正是打造能夠驅動科學革命的工具平臺——通過 AGI 實現跨學科的深度融合與顛覆性創新的系統性涌現。

05 第五問驗證之問：如何判斷AI有能力做出重大科學發現

第五個問題：驗證之問。

我們應如何判斷 AI 有能力做出重大科學發現？

當前，我們對AI for Science抱有極高期望——不僅希望它輔助解題或進行數學模擬，更期待它實現真正意義上的重大科學突破。

自 2022 年以來，我持續思考一個思想實驗，并將其確立為團隊和學生的核心研究課題。實驗的設定如下：假設我們開發出了一套卓越的 AI for Science 系統或大模型，那么應如何驗證其科學發現能力？我的提議是：將該系統“送回”1905 年（那一年愛因斯坦剛剛提出狹義相對論），限定該AI系統僅基于1905年之前的所有科學論文與已知觀測結果，那么它能否自主推導出廣義相對論？我認為，這是衡量“AGI for Science”能否實現終極突破的關鍵設問。

這一思想實驗的本質，是追問科學突破的根本來源。廣義相對論究竟是如何誕生的？科學研究的躍進究竟依賴什么？我曾在今年的中關村論壇也分享過這一觀點：科學研究的核心并非僅靠工具提升局部效率，而在于對“研究者—研究工具—研究對象”三者關系的系統性重構與本質思考。

以相對論為例：研究者愛因斯坦擁有非凡的物理直覺與思維洞察，尤其對等效原理具有深刻把握。據他回憶，某些具體對象（如坐在電車上看見鐘樓時構想“若電車以光速行駛會如何”）激發了他通過思想實驗推演出狹義相對論。然而，受限于當時未能掌握黎曼幾何，愛因斯坦未能立即將狹義相對論推演至廣義形式——直至引入“黎曼幾何”。

因此，這一思想實驗的關鍵并不在于 AI 系統讀了多少論文，畢竟如今的大模型閱讀海量文獻已不足為奇，真正的差異化能力在于：能否將“黎曼幾何”與狹義相對論相結合，從而推導出廣義相對論？這對 AI 系統提出了更高要求：它必須對物理具備直覺般的推演能力、從實驗現象（如水星軌道近日點的驗證）中獲得啟發，并能跨學科融合數學與物理知識，從而實現真正的科學范式躍遷。

上述正是“驗證之問”的意義。我們不能僅滿足于宣稱某個模型“達到了博士水平”，而應朝著遠大的目標持續探索。盡管當前這一目標仍很遙遠，但正如任何偉大事業都需要宏偉的愿景，這也應當成為 AGI for Science 堅定不移的方向。

06 第六問新科學之問：AGI將輔助更多學科發展“精確”視

第六個問題：新科學之問。

當前，不少研究者正致力于推動“AI for Social Science”與“AI for Engineering”。我認為，這些方向與“AI for Science”并無本質區別，因為它們共同的核心，都是重構研究者、研究對象與研究工具三者之間的關系。上述五個問題——邊界之問、預測之問、語言之問、交叉之問與驗證之問——同樣適用于社會科學與工程領域。

但我更想強調，AI 的出現與能力提升，為社會科學與工程研究帶來了顛覆性的新機遇。在藝術、歷史、哲學等人文社科領域中，許多學科已發展得相當成熟，那么AI能否為社會科學研究者提供新的分析視角與更精確的度量工具？

科學的發展往往始于對精確的度量與推理的追求。例如在藝術領域，為什么眾人皆認為，徐悲鴻的馬寥寥數筆卻神韻非凡？為什么留白成為中國藝術中的高級表達？這些審美判斷背后是否存在可量化的美學原則？

我們曾使用西方主流閉源大模型對梵高和徐悲鴻的作品進行評分，結果發現前者得分很高，后者卻非常低。這顯示出模型受限于訓練數據與價值觀偏見，因而未能真正理解東方美學中的精妙表達。

為此，上海人工智能實驗室與中國美術學院聯合推出“書生·妙析”美學大模型，基于 Intern-S1"書生"大模型和 Intern·Bootcamp大模型“加速訓練營”，以可量化的方式，“教會”模型如何理解徐悲鴻筆下的馬、如何鑒賞留白的意境。這一探索帶來了新的啟示：對于所有的社會科學，能否從非結構化的原始數據中，識別出具有研究價值的模式與特征？

另一方面，“可重復驗證”是科學的關鍵標準，AI能否推動社會科學乃至工程實驗，實現如自然科學般的可重復性？我們能否借助大規模、可重復的AI實驗（類比自由落體、粒子對撞實驗等），提供系統研究框架、激發創新視角？

當然，必須明確指出：我們提出“AGI for Science”，并非要以 AGI 取代人類，而是強調人與 AI 的協同。科研是一項高層次的智力活動，其中蘊含了人類的生物多樣性、個體體驗以及深層的哲學與文化思考。“AGI for Science” 必須以精細而審慎的方式推進，不能僅將 AGI 視為工具交付給科學家，而應構建以科學家為中心，人類與 AGI 高度協作的新范式。

人類科學家的珍貴品質更不能忽視：例如，阿基米德在外敵入侵的生死關頭，保護的是未完成的證明，對科學的執著超越個體存亡；基于數學形式的優雅與內在和諧的科學直覺，更讓麥克斯韋堅信并預言了電磁波的存在；費曼說“科學是偉大的娛樂”，許多人讀過《別逗了費曼先生》，書中記錄了許多旺盛好奇心的故事；特別值得一提的是，中國科學家屠呦呦，在200余種不同樣品失敗后，單對于青蒿一種，第191次實驗中才“真正發現了有效成分”，這些堅韌美好的品質，是人類科學事業中不可替代的核心。

因此，我們認為真正的 AGI for Science，應是以人類科學精神和智力為羅盤、以 AGI 為引擎的協同探索，絕不能本末倒置。

如果我們認同“預測未來最好的方式就是創造未來”，在這條邁向 AGI for Science 的路途上，浦江論壇“六問”為我們提供了一個思考的框架：既需清醒認識到當下可能被高估的能力邊界、預測可靠性與語言表征的局限，也要關注那些被低估的遠方——尤其是交叉學科的涌現、驗證機制的建立和新科學范式的形成。

我們需要應統籌資源、做好整體規劃，致力于 AGI for Science 的長遠布局。我們不能簡單地提“AI for 某學科”，而應前瞻那些尚未形成的新交叉領域。未來的突破，將來自于人類與 AGI 的共同探索，讓科學變得更有趣、更富成果，也更具獲得感。

浦江創新論壇由中華人民共和國科學技術部和上海市人民政府共同主辦，創設于2008年，論壇始終圍繞創新主題,旨在匯聚全球創新力量研討科技創新趨勢、構建開放創新生態、凝聚創新治理共識，積極應對時代挑戰和重要全球性問題。十八年來,論壇著力匯聚全球科技創新資源,推動創新鏈、產業鏈和服務鏈深度融合。數萬余名創新開拓者匯聚一堂。三千余位政界高層、學界泰斗和商界精英交鋒觀點“論壇+展覽"交相輝映,百多場主題活動描繪創新發展藍圖,上千家權威智庫和機構共結創新碩果,一大批研究和合作成果傳遞創新理念。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.