![]()
新智元報道
編輯:編輯部
【新智元導讀】48小時,50年數學謎題就被破解!AI與全球數學家夢幻聯動,從游戲分硬幣到正方形填充,層層拆解埃爾德什遺留難題,人機協作徹底引爆了數學研究新范式。
剛剛,AI又破解了一個數學難題!
Erdos#1026問題已經被攻克,且給出了正式證明。
而在此之前,這個問題已經困擾了數學界50年。
![]()
陶哲軒在Mastodon上宣布了這一消息,還在一篇博客中詳細講述了這個故事。
![]()
他強調,在AI的輔助下,人類團隊僅用了48小時,就順利攻克了這一難題。
并且,AI在此過程中帶來的是全新理解,絕非搜索這么簡單。
要知道,如果是靠傳統方法,只靠數學家使用編程和文獻檢索,可能會需要數周甚至數月。
在這個過程中,AI實際上是在生成新的數學洞見,而不僅僅是檢索現有文獻。
Harmonic官網也宣布了這一消息,其AI系統Aristotle參與了此次解題過程。
![]()
Erdos
1975年,傳奇數學家保羅·埃爾德什在一篇論文的角落隨手寫下一個問題。
半個世紀后,這個問題靜靜躺在「埃爾德什問題網站」上,編號1026。
誰也沒想到,它會在2025年的最后一個月,被一群數學家利用AI工具,在短短48小時內徹底破解。
埃爾德什的原問題,讀起來有點像謎語。
![]()
給定一串不同的實數x1,x2,…,xn,定義S(x1,…,xn)為所有單調子序列(遞增或遞減)的最大可能和。
這個函數有什么性質?
問題一出,大家面面相覷:這到底要問什么?是求S的表達式?還是找它和總和的比值下界?
2025年9月12日,問題被掛上網站時,附加了一條注釋:「該問題表述較為模糊。」
但數學家的本能,就是要把模糊變成精確。
當天,網友Desmond Weisenberg提出了一個清晰的游戲化解釋:
Alice和Bob的硬幣游戲
Alice有N枚硬幣,她分成n堆,每堆xi枚(xi可不同)。Bob可以選取一個單調的子序列(遞增或遞減),拿走這些堆里所有硬幣。
問:無論Alice怎么分堆,Bob至少能拿到總硬幣數的多少比例?
這個比例,記作c(n)。
![]()
從n=3到平方數猜想
可以先看這樣幾個例子。
![]()
很快,Stijn Cambie發現:
如果Alice把硬幣分成k2堆,每堆差不多大,并排列成k個遞減塊,每塊k 堆,塊之間遞增,那么最長單調子序列只有k堆。
于是Bob最多拿到1/k的比例,也即c(k2)≤1/k。
反過來,Wouter van Doorn用已有結果給出下限:c(n)≥(1/√2)/√n。
那么,√n·c(n)的極限是多少?它在1/√2和1之間。
第二天,Stijn手算小n的值:
![]()
數據雖少,但已足夠讓他大膽猜想:c(k2)=1/k。
這意味著√n·c(n)→1,Bob在n很大時幾乎能保證拿到約1/√n的比例。
AI出手了!
兩個月后,2025年12月7日,Boris Alexeev用AI工具Aristotle在證明輔助語言Lean中自動證出了c(k2)=1/k。
幾乎同時,Koishi Chan給出一個優美的人類證明——「膨脹法」。
![]()
至此,上下界合一,猜想成功得證。
更巧的是,這個答案,其實早就存在了。
Google Scholar很快找到一篇2016年論文,其中已有此結果,并引用了更早的Wagner用「膨脹法」處理埃爾德什-塞凱賴斯定理的工作。
原來,數學早已悄悄解決過這個問題,只是未被鏈接到埃爾德什的原始提問。
AI登場
猜出完整公式
但故事的高潮還在后面。
陶哲軒決定用另一個AI工具AlphaEvolve系統探索c(n)。
![]()
他讓AI嘗試構造使S盡量小的序列,很快得到n=1到16的數值結果:
![]()
這些分數看似雜亂,但重新排列后,模式逐漸浮現了出來。
![]()
Boris從中提煉出干凈公式:
![]()
并構造出極值序列:用「紅」「藍」兩種數值的塊交替排列,控制單調子序列的長度。
下圖直觀展示了該構造(a≥0的情形):
![]()
而1/c(n)的圖像,正是對√n的分段線性逼近:
![]()
連接經典
正方形填充問題
隨后,Lawrence Wu指出:此問題等價于一個正方形填充問題(埃爾德什問題106)。
![]()
Lawrence證明:c(n)≥1/f(n)。
理由:對任意序列,可構造一系列正方形,它們互不重疊地填滿邊長為S(x1,…,xn)的大正方形。
下圖展示了從AlphaEvolve給出的一個序列構造出的正方形填充。
![]()
最后一擊
文獻中的完整解
Lawrence再用AI深度搜索,找到了2024年Baek、Koizumi、Ueoro的論文,其中證明:f(k2+2c+1)≤k+c/k。
結合Praton的嵌入論證,這恰好給出:c(k2+2a+1)≤k/(k2+a)。
上下界再次吻合,猜想完全得證!
AI+人類
48小時極限突圍
這個故事最讓陶哲軒觸動的一點是,能匯聚一群不同背景的人、文獻和工具來攻克這個問題,是何等重要。
陶哲軒感慨道:
傳統模式下,一兩位數學家憑借簡單工具,或許最終也能拼出全貌,但那可能需要數周甚至數月。而在這個協作網絡中,所有關鍵環節在48小時內匯聚。
要陳述并證明c(n)的精確公式,需要基于多個觀察結果,大概包括以下幾點:
該序列可以被數值計算為有理數序列。
經過適當的歸一化和排列后,序列中會出現肉眼可見的規律,讓人能推測出序列的形式。
這個問題是Erd?s-Szekeres定理的一個加權版本。
在Erd?s-Szekeres定理的眾多證明中,1959年Seidenberg的證明可以被解釋為一種離散矩形填充論證。
這個問題可以被重新解釋為連續正方形填充問題,實際上與Erd?s問題106(關于此類填充)的(廣義軸平行形式)密切相關。
Erd?s問題106的軸平行形式最近剛被Baek-Koizumi-Ueoro解決。
Praton的論文表明,Erd?s問題106蘊含了這個問題所需的廣義版本。這個蘊含關系特指軸平行的情況。
正是靠著所有貢獻者的通力合作以及他們使用的工具,所有這些關鍵線索才得以在48小時內匯集在一起。
如果換作傳統的模式,只靠一兩個數學家以及更簡單的編程和文獻搜索工具,雖然理論上最終也能把這些碎片拼湊起來,但這個過程會花長得多的時間(可能是數周甚至數月)。
另一個關鍵因素是Erd?s問題網站上「平衡的AI政策」,它鼓勵公開說明AI的使用情況,同時強烈反對隱瞞使用——
允許使用AI輔助編寫評論,前提是:
(a)已對此進行公開說明;
(b)內容(包括數學推導、代碼、數值數據及相關來源的存在性)已由用戶自己在沒有AI協助的情況下仔細核查與驗證;
(c)評論篇幅在合理范圍內,不過于冗長。
![]()
一道懸置50年的問題,在2025年的冬天,因為一次跨人機、跨時空的奇妙協作,終于畫上了圓滿的句號。
而這,可能只是一個新時代的開始。
參考資料:ZHB
https://terrytao.wordpress.com/2025/12/08/the-story-of-erdos-problem-126/
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.