
隨著人工智能科技的不斷發展,其在邏輯推理能力上的表現也在不斷給人留下深刻的印象。知名數學家陶哲軒對AI在數學中的應用早已從懷疑轉向擁抱。
而這一次被震驚的科學家是理論計算機科學界的知名科學家Scott Aaronson(斯考特阿倫森),他在最近的中提到自己在證明一個與量子復雜性理論相關的問題時,使用GPT-5輔助完成了一個關鍵步驟的證明。
“This is the first paper I’ve ever put out for which a key technical step in the proof of the main result came from AI—specifically, from GPT5-Thinking."
“這是我發表的首篇主要結論的證明有AI參與的論文,證明中的核心步驟由AI——即GPT5-Thinking——所給出。”
![]()
▲圖片來源:https://scottaaronson.blog/?p=9183
當然,GPT-5也并非聰明到可以獨自完成該項研究,事實上它在最初的幾次回復中也出現了明顯的錯誤。
![]()
▲圖片來源:https://chatgpt.com/share/68db5e26-78bc-8011-b484-2422836e94f4
但在與其多次溝通后() ,GPT-5也成功給出了令Scott Aasonson滿意的結果。
“...there’s not the slightest doubt that, if a student had given it to me, I would’ve called it clever."
“……毫無疑問,如果是一個學生交給我這個證明,那我肯定會稱贊其巧妙。”
什么是QMA?
在介紹Scott嘗試解決的具體問題前,我們有必要簡單的科普一下什么是QMA(Quantum Merlin-Arthur)。
也許有些讀者聽說過與黎曼猜想、龐加萊猜想同屬于千禧年七大難題之一的“P =NP?”問題。其中,P和NP是理論計算機科學中按照問題難易程度對可計算問題劃分出的兩個類別。
簡單來說,如果一個問題屬于P類問題,那么我們可以“高效”地得到其答案,這里的“高效”是指我們可以將解決該問題所需要的計算時間寫成以該問題規模為自變量的一個多項式。而如果一個問題屬于NP類問題,那么我們可以“高效”地驗證一個該問題的解的正確性。
因此我們也許會好奇“對于一個問題,如果我們能高效地驗證其解的正確性,那么是否存在一種方法能夠使我們高效地得到它的一個解呢?”,雖然目前大部分科學家們認為這種假設不成立,也即P不等于NP,但是目前尚未有人成功地證明或證偽該命題。
而QMA類問題在量子計算復雜性中的角色可以類比于NP類問題在經典計算復雜性中的角色。
![]()
▲圖片來源:知乎答主“Climber.pl”(https://zhuanlan.zhihu.com/p/20562470)
我們可以想象這樣的一個虛構法庭:在法庭上一位擁有量子計算能力的巫師(Merlin) 正在試圖向一位國王(Arthur)證明一個命題的真實性,在雙方的辯論中,Merlin會向Arthur提交證據(一個量子態)。如果一個問題屬于QMA類問題,那么Arthur將能夠高效的驗證Merlin提交的證據的正確性,并且
·完備性:若Merlin提交了正確的證據,那么Arthur采納它的概率不低于2/3
·可靠性:如果Merlin提交了錯誤的證據,那么Arthur采納它的概率不超過1/3
Scott用GPT做了什么?
在Scott的研究中,他將GPT-5(具體為GPT-5-Thinking模型)運用到了證明使用黑盒放大對QMA進行增強的極限在哪里,即通過黑盒放大這種方法是否能使得當Merlin提交正確證據時Arthur采納的概率等于1。
![]()
在證明的過程中,有一個步驟涉及到分析一個實參數三角多項式構成的厄米矩陣的最大特征滿足的某些性質。實際上,該步驟的證明對于頂級科學家而言,并不非常困難,Scott花上一兩周進行嘗試亦可獨立完成。在其博客的評論區,也有人提出了更好的函數構造。但令Scott驚訝的點在于:一年前的GPT尚不能在類似的問題上取得令人滿意的回答,然而現在它已經能涉足人類智力活動中最精妙的領域之一。
這并不令人驚訝,在AI產品種類越來越多的當下,使用AI輔助工作已經成為隨處可見的日常。從搜集信息到推導公式、編程,AI早已悄悄從我們印象里前兩年的那個會在初等算數上犯錯的”小學生“,變成了只要加以適當的指導便能完成復雜任務的“大學生”。
雖然目前的AI尚不能獨立完成整個研究工作,但是目前它完全可以充當一個聽話的“小助手”,讓它幫你完成一些小任務;而你則可以充當一個“導師”,為其分解任務并驗證其結果的正確性。當然,前提是你得對該領域有基礎的了解,否則遇到AI胡編亂造的結論你也難以辨別真偽。但是誰又知道距離下一次AI能力的突變還有多久呢?連Scott也開玩笑稱還好自己早已拿到終生教職。
"I guess I should be grateful that I have tenure."
“我想,我應該慶幸我已經有終生教職了。”
![]()
▲圖片來源:https://scottaaronson.blog/?p=9183
總的來說,人與AI的交互目前已經進入了某種程度上的”蜜月期“,只要掌握好方法,哪怕是在計算理論這種高難度的領域也能助你一臂之力。對于我們的讀者,如果你仍然覺得AI距離實用仍有一段距離,那么不妨嘗試在你的日常工作中使用AI來幫你完成一些小任務。也許體驗過后,你也能理解為什么連著名的理論計算機科學家也會為之震驚。
![]()
▲圖片來源:小編罷工的deepseek
*本文部分內容由A1生成與校驗(笑)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.