一塊閃亮的數(shù)學(xué)獎(jiǎng)牌,剛剛被寫入代碼的智能體在6小時(shí)內(nèi)摘下,而人類為此思考了30年。
PART 01
AI六小時(shí)破解30年數(shù)學(xué)難題
2025年12月,人工智能領(lǐng)域迎來里程碑事件:Harmonic公司開發(fā)的AI系統(tǒng)“亞里士多德”僅用6小時(shí)便攻克了困擾數(shù)學(xué)界30年的埃爾德什問題#124簡(jiǎn)化版。這一突破被學(xué)界稱為“數(shù)學(xué)智能體時(shí)代的開端”,而菲爾茲獎(jiǎng)得主陶哲軒則犀利指出:AI正在高效收割數(shù)學(xué)界的“低垂果實(shí)”,讓人類研究者得以聚焦更具挑戰(zhàn)性的核心問題。
![]()
埃爾德什問題#124自1995年提出以來,一直是組合數(shù)論領(lǐng)域的頑固堡壘。其核心命題探討:給定k個(gè)不小于2的自然數(shù)d?,若∑1/(d?-1) ≥ 1,是否所有足夠大的自然數(shù)n都能表示為特定0-1組合的和?這個(gè)看似簡(jiǎn)潔的問題,卻讓數(shù)學(xué)家們?cè)谧畲蠊s數(shù)(gcd)約束和邊界案例驗(yàn)證中陷入長(zhǎng)達(dá)三十年的僵局。
“亞里士多德”的突破性在于其完全獨(dú)立的證明能力。它采用創(chuàng)新的“vibe proving”方法論,融合強(qiáng)化學(xué)習(xí)與蒙特卡洛樹搜索,在無需人類干預(yù)的情況下遍歷上億種證明路徑,最終輸出100%可驗(yàn)證的定理。整個(gè)過程僅耗時(shí)6小時(shí),而通過Lean形式化驗(yàn)證系統(tǒng)的檢驗(yàn)只需1分鐘。
![]()
耐人尋味的是,當(dāng)通用AI巨頭ChatGPT和Gemini面對(duì)同一問題時(shí),卻集體“折戟”。陶哲軒分析指出:Gemini僅能給出排除數(shù)字1后gcd條件成為必要的基礎(chǔ)觀察;ChatGPT則表現(xiàn)出明顯的“路徑依賴”,大量引用已有網(wǎng)頁和論文,未能提出原創(chuàng)性觀點(diǎn)。
這種差異揭示了專業(yè)AI與通用AI的本質(zhì)分野——當(dāng)“亞里士多德”被設(shè)計(jì)為“邏輯工匠”,基于形式邏輯生成可驗(yàn)證代碼時(shí),ChatGPT類模型仍是“猜詞機(jī)器”,依賴統(tǒng)計(jì)概率生成文本。
PART 02
“人機(jī)協(xié)同”的科研革命
陶哲軒將數(shù)學(xué)未解問題的分布描述為“長(zhǎng)尾特征”。大多數(shù)難題并非超高難度,而是因人類數(shù)學(xué)家資源有限而被擱置的“低垂果實(shí)”。AI的自動(dòng)化能力恰恰擅長(zhǎng)處理這類問題。
![]()
在埃爾德什問題網(wǎng)站上,“未解”標(biāo)簽最近減少了近十個(gè),這并非因?yàn)槿祟愅蝗唤鉀Q了這些問題,而是AI通過文獻(xiàn)檢索發(fā)現(xiàn)它們?cè)缫驯还タ恕_@種現(xiàn)象揭示了AI作為“清道夫”的價(jià)值——它能清理最容易解決的問題,讓人類聚焦于真正具有挑戰(zhàn)性的核心難題。
HarmonicMath創(chuàng)始人Vlad Tenev提出的“Vibe證明時(shí)代”已經(jīng)到來。這一概念意味著AI不僅能輔助驗(yàn)證,還能獨(dú)立創(chuàng)造。在數(shù)學(xué)領(lǐng)域,這種變革尤為深刻,因?yàn)閿?shù)學(xué)的形式化特性使其非常適合AI參與。
![]()
微軟前AI副總裁Sebastien Bubeck激動(dòng)地分享道:“該解決方案100%由AI生成,總計(jì)耗時(shí)6小時(shí)。”這一效率與人類數(shù)學(xué)家30年的掙扎形成鮮明對(duì)比,凸顯了AI在科研效率方面的革命性提升。
PART 03
AI當(dāng)前局限與信息學(xué)學(xué)生的不可替代性
盡管“亞里士多德”取得了突破,但它解決的是原問題的簡(jiǎn)化版本。原版埃爾德什問題#124不允許使用數(shù)字1且需要滿足額外的最小公約數(shù)條件,這一更復(fù)雜的版本仍有待解決。
AI在數(shù)學(xué)推理中面臨的主要挑戰(zhàn)之一是“超長(zhǎng)推理鏈”問題。高中數(shù)學(xué)證明可能只需10到40步,而像黎曼猜想這樣的難題,證明路徑可能長(zhǎng)達(dá)百萬步。美國(guó)加州理工學(xué)院的謝爾蓋·古科夫指出,這類超長(zhǎng)路徑極難處理,AI必須在指數(shù)級(jí)增長(zhǎng)的可能路徑中找到正確解法。
![]()
DeepMind的AlphaProof和AlphaGeometry2在國(guó)際奧數(shù)競(jìng)賽中表現(xiàn)出色,但專家們普遍認(rèn)為,它們?nèi)匀狈φ嬲臄?shù)學(xué)洞察力。競(jìng)賽題有一定“套路”,而真正的數(shù)學(xué)研究更開放、復(fù)雜。初創(chuàng)公司Epoch AI的FrontierMath測(cè)試顯示,面對(duì)全新技術(shù)難題,LLM幾乎集體“交白卷”。
數(shù)學(xué)家董彬指出,AI在數(shù)學(xué)研究中的理想角色是“AI學(xué)徒”——用訓(xùn)練數(shù)學(xué)家的方式培養(yǎng)AI助手。但目前,AI更適用于“單點(diǎn)突破”,從局部解決某些具體問題,而非全面替代人類直覺和創(chuàng)造力。
PART 04
信息學(xué)學(xué)生的四維能力重構(gòu)
當(dāng)AI開始收割數(shù)學(xué)“低垂果實(shí)”,信息學(xué)學(xué)生亟需重構(gòu)能力模型,在以下四個(gè)維度建立新優(yōu)勢(shì):
人機(jī)協(xié)同的架構(gòu)思維——“亞里士多德”的成功源于其專業(yè)定位——與通用大模型不同,它專為數(shù)學(xué)證明設(shè)計(jì),融合強(qiáng)化學(xué)習(xí)、蒙特卡洛樹搜索與Lean形式化語言。這種“領(lǐng)域?qū)S弥悄堋奔軜?gòu)思維值得信息學(xué)學(xué)生深入學(xué)習(xí)。正如DeepSeek-V3.2-Speciale模型展現(xiàn)的,通過融合定理證明能力,專業(yè)模型在IMO、ICPC等賽事中已超越多數(shù)人類選手。
形式化驗(yàn)證的必備技能——Lean證明系統(tǒng)的應(yīng)用標(biāo)志著數(shù)學(xué)驗(yàn)證進(jìn)入程序化時(shí)代。信息學(xué)學(xué)生需掌握形式化驗(yàn)證工具,將自然語言證明轉(zhuǎn)化為機(jī)器可驗(yàn)證代碼。這不僅是防范AI幻覺的有效手段,更是未來科研協(xié)作的基礎(chǔ)能力。埃爾德什#124的證明在GitHub公開后,全球研究者均可參與驗(yàn)證與拓展(github.com/plby/lean-proofs)。
直覺引導(dǎo)的算法設(shè)計(jì)——當(dāng)前AI在依賴性質(zhì)觀察與解題直覺的題目上仍存在明顯局限。如AlphaProof解決3個(gè)IMO問題耗時(shí)3天,而人類選手僅需4.5小時(shí)。信息學(xué)學(xué)生應(yīng)強(qiáng)化元認(rèn)知能力,在AI陷入局部最優(yōu)時(shí)提供方向性指導(dǎo),這正是人類思維不可替代的核心價(jià)值——正如PatternBoost AI系統(tǒng)開發(fā)者所言:“探索性思維是數(shù)學(xué)的核心”。
問題發(fā)現(xiàn)的戰(zhàn)略眼光——倫敦?cái)?shù)學(xué)科學(xué)研究所何楊輝指出:AI能幫助證明問題,卻無法幫助確定需要解決的關(guān)鍵問題。信息學(xué)學(xué)生需培養(yǎng)科學(xué)發(fā)現(xiàn)的前瞻力,在AI清理“低垂果實(shí)”后,精準(zhǔn)識(shí)別真正值得攻堅(jiān)的“數(shù)學(xué)高峰”。這種能力建立在對(duì)學(xué)科發(fā)展脈絡(luò)的深刻理解與跨領(lǐng)域知識(shí)融合基礎(chǔ)上。
PART 05
教育轉(zhuǎn)型:從工具使用者到智能體架構(gòu)師
面對(duì)AI的沖擊,信息學(xué)教育正在經(jīng)歷范式轉(zhuǎn)變。2025年CNCC論壇達(dá)成共識(shí):信息學(xué)奧賽應(yīng)繼續(xù)堅(jiān)持以計(jì)算思維培養(yǎng)為核心,同時(shí)更加重視學(xué)生發(fā)現(xiàn)問題和提出問題的能力。微軟前AI副總裁塞巴斯蒂安·布貝克激動(dòng)地分享AI攻克埃爾德什難題的消息時(shí),強(qiáng)調(diào)“解決方案100%由AI生成”。
![]()
但走進(jìn)普林斯頓高等研究院,數(shù)學(xué)家們已在全新實(shí)驗(yàn)室工作:人類提出大膽猜想,AI負(fù)責(zé)驗(yàn)證與反例生成;人類構(gòu)建理論框架,AI完成繁瑣計(jì)算;人類捕捉靈感火花,AI將其轉(zhuǎn)化為嚴(yán)謹(jǐn)證明。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.