![]()
大數(shù)據(jù)文摘出品
陶哲軒(Terence Tao),最近在一個(gè)學(xué)術(shù)問(wèn)答網(wǎng)站上,親口講述了自己如何用 ChatGPT 解出一道數(shù)學(xué)問(wèn)題。
他在MathOverflow上發(fā)帖,原本只是想驗(yàn)證一組復(fù)雜的不等式。
![]()
他已經(jīng)有了理論分析,卻需要一組“具體數(shù)值”來(lái)驗(yàn)證推導(dǎo)是否成立。
過(guò)去,這類問(wèn)題往往要靠程序員式的笨功夫——寫(xiě) Python、調(diào)參數(shù)、跑模型。
但這一次,陶哲軒找了 ChatGPT。起初,AI 給出的代碼并不完美。運(yùn)行速度太慢,參數(shù)設(shè)置也不對(duì)。
陶哲軒沒(méi)有放棄,而是一步步拆解問(wèn)題,與 ChatGPT 對(duì)話,修正每一個(gè)邏輯環(huán)節(jié)。
當(dāng)他重新構(gòu)建問(wèn)題背景后,ChatGPT 終于找到了合適的參數(shù)。
最后,他用同樣由 ChatGPT 生成的一小段 Python 代碼驗(yàn)證了結(jié)果。
“我沒(méi)有遇到幻覺(jué)或無(wú)意義的回答,”陶哲軒寫(xiě)道,“整個(gè)過(guò)程順暢得令人驚訝。”
AI,節(jié)省了他幾個(gè)小時(shí)
陶哲軒說(shuō),這一過(guò)程為他節(jié)省了數(shù)小時(shí)。如果沒(méi)有 AI,他得自己從零寫(xiě)腳本、測(cè)試、調(diào) bug。那不僅要時(shí)間,更要極強(qiáng)的耐心。
“AI 能利用上下文,自動(dòng)發(fā)現(xiàn)我請(qǐng)求中的數(shù)學(xué)錯(cuò)誤,并在生成代碼前修正。”他寫(xiě)道。
他甚至承認(rèn),如果沒(méi)有 AI,他可能根本不會(huì)嘗試這類“數(shù)值搜索”,而是退回到更抽象的理論推演。
換句話說(shuō),ChatGPT 讓他做了一件自己原本不會(huì)做的事。那一刻,他不是在寫(xiě)代碼,而是在與一個(gè)懂?dāng)?shù)學(xué)的助手對(duì)話。
一個(gè)能理解公式結(jié)構(gòu)、能指出他思路漏洞、還能幫他“動(dòng)手實(shí)驗(yàn)”的助手。
陶哲軒對(duì) AI 并不盲目。他在總結(jié)中寫(xiě)道:自己對(duì)大語(yǔ)言模型總體持開(kāi)放態(tài)度,但也懷疑它們能否推動(dòng)真正的數(shù)學(xué)創(chuàng)新。
AI 擅長(zhǎng)處理具體問(wèn)題,卻難以提出真正的新理論。但他也認(rèn)為,這并非壞事。
在他看來(lái),未來(lái)的數(shù)學(xué)研究將進(jìn)入一個(gè)全新階段“工業(yè)化數(shù)學(xué)”(industrial-scale mathematics)。
那是一個(gè)人機(jī)協(xié)作的時(shí)代。成百上千的研究者,配合 AI 工具,一起處理宏大的數(shù)學(xué)問(wèn)題。
就像制造業(yè)流水線一樣,AI 可以承擔(dān)重復(fù)計(jì)算、驗(yàn)證與代碼生成;人類負(fù)責(zé)抽象推理與方向判斷。
他把這種變化比作“國(guó)際象棋的轉(zhuǎn)折點(diǎn)”。AI 沒(méi)有取代棋手,但徹底改變了他們的訓(xùn)練與思維方式。
如今,頂尖棋手離不開(kāi)計(jì)算機(jī)分析,同樣,未來(lái)的數(shù)學(xué)家也將離不開(kāi) AI 推理。
今年以來(lái),Google 與 OpenAI 都在推進(jìn)高級(jí)數(shù)學(xué) AI 系統(tǒng)。這些系統(tǒng)并未公開(kāi)發(fā)布,但已在多項(xiàng)競(jìng)賽中亮相。
兩家公司都報(bào)告稱,他們的通用推理模型(并非專門訓(xùn)練的數(shù)學(xué)系統(tǒng))在國(guó)際數(shù)學(xué)奧林匹克(IMO)和國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽(ICPC)上拿下金牌。
這意味著,AI 已能與頂尖人類選手同臺(tái)競(jìng)技。Meta、Anthropic 等公司也在開(kāi)發(fā)自己的數(shù)學(xué)推理框架,希望讓 AI 能夠“像人類一樣思考公式”。
陶哲軒在文章中暗示,AI 在數(shù)理科學(xué)中的潛力被嚴(yán)重低估。
他認(rèn)為,AI 不一定要“發(fā)現(xiàn)新定理”,只要能讓人類更快地驗(yàn)證假設(shè)、更穩(wěn)地構(gòu)建模型,就已經(jīng)足夠革命性。
以下是原文,由DeepSeek翻譯:
我通過(guò)與 AI進(jìn)行一場(chǎng)長(zhǎng)時(shí)間的交流,成功地找到了一個(gè)數(shù)學(xué)問(wèn)題的答案。
對(duì)話記錄:https://chatgpt.com/share/68ded9b1-37dc-800e-b04c-97095c70eb29
MathOverflow原貼:https://mathoverflow.net/questions/501066/is-the-least-common-multiple-sequence-textlcm1-2-dots-n-a-subset-of-t/501125
我此前已經(jīng)做過(guò)理論分析,認(rèn)為這個(gè)問(wèn)題的答案應(yīng)當(dāng)是否定的。但要想構(gòu)造出確鑿的反例,還需要一些滿足特定不等式的數(shù)值參數(shù)。起初,我希望讓 AI 生成一段 Python 代碼,用來(lái)搜索反例并由我自己運(yùn)行與調(diào)整。結(jié)果發(fā)現(xiàn),這樣的搜索耗時(shí)極長(zhǎng),而且最初設(shè)定的參數(shù)范圍幾乎注定會(huì)失敗。
于是我改變策略,改為與 AI 進(jìn)行逐步推理的對(duì)話,讓它用啟發(fā)式計(jì)算的方法幫助我找出可行的參數(shù)范圍。經(jīng)過(guò)多輪推演,AI 最終給出了合適的參數(shù)。我隨后獨(dú)立進(jìn)行了驗(yàn)證(確實(shí)使用了它生成的一段29 行的 Python 程序,但代碼結(jié)構(gòu)簡(jiǎn)單、邏輯清晰,我可以直接看懂它在做什么,而且算出的數(shù)值也與此前的啟發(fā)式預(yù)測(cè)相吻合)。
在這個(gè)過(guò)程中,AI 工具大大節(jié)省了我的時(shí)間,若完全靠自己完成同樣的任務(wù),恐怕得花上好幾個(gè)小時(shí)編寫(xiě)和調(diào)試代碼。AI 能根據(jù)上下文識(shí)別出我請(qǐng)求中的若干數(shù)學(xué)錯(cuò)誤,并在生成代碼前自動(dòng)修正。事實(shí)上,如果沒(méi)有 AI 協(xié)助,我大概率根本不會(huì)嘗試這種數(shù)值搜索,而是會(huì)轉(zhuǎn)而進(jìn)行更抽象的漸近分析。
注:頭圖AI生成
作者長(zhǎng)期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù),歡迎對(duì)這些方向感興趣的朋友添加微信Q1yezi,共同交流行業(yè)動(dòng)態(tài)與技術(shù)趨勢(shì)!
GPU 訓(xùn)練特惠!
H100/H200 GPU算力按秒計(jì)費(fèi),平均節(jié)省開(kāi)支30%以上!
掃碼了解詳情?
點(diǎn)「贊」的人都變好看了哦!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.