![]()
全球觀(guān)察者深度出品
縱橫寰宇,洞察時(shí)代風(fēng)云
最近硅谷的AI圈子跟炸開(kāi)鍋一樣,OpenAI扔出了個(gè)大招GPT-5.2"Thinking"版本。
這東西一出來(lái),谷歌和Anthropic的股價(jià)都波動(dòng)了,程序員群里都在討論自己會(huì)不會(huì)失業(yè),連馬斯克都發(fā)推說(shuō)“這玩意比想象中來(lái)得快”。
![]()
今天咱們就來(lái)聊聊,這個(gè)讓整個(gè)行業(yè)震動(dòng)的GPT-5.2到底是個(gè)什么狠角色。
以前咱們用AI,感覺(jué)就像跟個(gè)超級(jí)學(xué)霸聊天,啥都知道,但你問(wèn)它為啥這么答,它可能自己也說(shuō)不清楚。
GPT-5.2最不一樣的地方,就是它開(kāi)始有“解題思路”了。
![]()
舉個(gè)例子,AIME數(shù)學(xué)邀請(qǐng)賽,這可是美國(guó)頂尖高中生都頭疼的競(jìng)賽,GPT-5.2拿了滿(mǎn)分。
以前的AI做題像背書(shū),遇到?jīng)]見(jiàn)過(guò)的題型就抓瞎。
現(xiàn)在它會(huì)一步步推導(dǎo),中間算錯(cuò)了還會(huì)倒回去檢查,跟咱們上學(xué)時(shí)解題一模一樣。
GPQADiamond測(cè)試拿了92.4%的得分,比谷歌Gemini3Pro高了0.5個(gè)百分點(diǎn)。
![]()
別小看這0.5%,在藥物研發(fā)或者材料科學(xué)領(lǐng)域,可能就是“能成藥”和“不能成藥”的區(qū)別。
有藥企的朋友說(shuō),他們用這模型篩選分子結(jié)構(gòu),效率比以前提高了十倍不止。
最厲害的是抽象推理能力。
ARC-AGI測(cè)試?yán)铮珿PT-5.2拿了86.2%,把Gemini甩了11個(gè)百分點(diǎn)。
![]()
簡(jiǎn)單說(shuō),就是給它個(gè)從沒(méi)見(jiàn)過(guò)的問(wèn)題,它能舉一反三。
比如教它“蘋(píng)果比梨重”,它能推理出“梨比蘋(píng)果輕”,這種能力以前只有人類(lèi)才有。
當(dāng)然谷歌也不是吃素的,F(xiàn)rontierMathLevel4測(cè)試?yán)铮珿emini拿了18.8%,比GPT-5.2的14.6%高。
![]()
說(shuō)明在最前沿的數(shù)學(xué)探索領(lǐng)域,谷歌還有一手。
但綜合來(lái)看,GPT-5.2已經(jīng)形成了統(tǒng)治級(jí)優(yōu)勢(shì)。
SWE-BenchPro測(cè)試?yán)铮珿PT-5.2代碼能力拿了55.6%,超過(guò)了Claude和Gemini。
這意味著什么?以前AI寫(xiě)代碼是“補(bǔ)全”,現(xiàn)在能獨(dú)立完成整個(gè)項(xiàng)目了。
![]()
有程序員吐槽,上周他用GPT-5.2改bug,連他自己都沒(méi)發(fā)現(xiàn)的邏輯漏洞,AI一眼就看出來(lái)了。
價(jià)格方面,OpenAI這次玩得很大。
標(biāo)準(zhǔn)版輸入1.75美元/百萬(wàn)token,輸出14美元;Pro版直接飆到輸入21美元,輸出168美元。
對(duì)比上一代GPT-5.1,Pro版貴了整整三倍。
![]()
說(shuō)實(shí)話(huà)這定價(jià)把不少人嚇一跳,但你細(xì)想就明白了。
對(duì)沖基金用它分析市場(chǎng),多算對(duì)一次可能賺幾千萬(wàn);藥企用它設(shè)計(jì)分子,早點(diǎn)研發(fā)出新藥利潤(rùn)上百億。
對(duì)這些大客戶(hù)來(lái)說(shuō),168美元簡(jiǎn)直是白菜價(jià)。
中小企業(yè)就別想了,這玩意根本不是給咱們用的。
![]()
以后AI行業(yè)可能會(huì)分成兩派,不差錢(qián)的巨頭用頂級(jí)模型拼效率,小公司只能用閹割版勉強(qiáng)維持。
這種分化,怕是未來(lái)幾年的常態(tài)。
谷歌和Anthropic肯定不會(huì)坐以待斃。
![]()
三家各有優(yōu)勢(shì),企業(yè)選AI模型跟選股票一樣,得看準(zhǔn)了押注,押錯(cuò)了可能整個(gè)業(yè)務(wù)都受影響。
現(xiàn)在整個(gè)行業(yè)都在討論,AI到底會(huì)不會(huì)取代人類(lèi)工作。
程序員、分析師、甚至部分科研人員,都感受到了壓力。
但換個(gè)角度想,以前咱們用計(jì)算器算賬,也沒(méi)見(jiàn)會(huì)計(jì)失業(yè),反而效率更高了。
![]()
AI可能也是這樣,淘汰重復(fù)勞動(dòng),逼著咱們提升創(chuàng)造力。
OpenAI的CEO奧特曼最近說(shuō),GPT-5.2只是開(kāi)始,明年還會(huì)有更大突破。
谷歌和Anthropic的實(shí)驗(yàn)室里,肯定也憋著大招。
這場(chǎng)軍備競(jìng)賽,已經(jīng)停不下來(lái)了。
![]()
但問(wèn)題也來(lái)了,AI越來(lái)越聰明,誰(shuí)來(lái)管?萬(wàn)一被壞人利用怎么辦?現(xiàn)在各國(guó)監(jiān)管都沒(méi)跟上,歐盟的AI法案管得了歐洲,管不了全球。
這種灰色地帶,以后只會(huì)越來(lái)越多。
說(shuō)到底,GPT-5.2就像一把雙刃劍。
用好了能解決癌癥、氣候變化這些大問(wèn)題,用不好可能加劇社會(huì)分化。
![]()
咱們普通人能做的,就是別被技術(shù)甩太遠(yuǎn),多學(xué)多看,畢竟AI再厲害,也是人類(lèi)發(fā)明的工具。
最后說(shuō)句實(shí)在話(huà),不管你怕不怕,AI革命已經(jīng)來(lái)了。
與其焦慮,不如想想怎么用好這些新工具。
說(shuō)不定過(guò)兩年回頭看,GPT-5.2只是AI改變世界的開(kāi)始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.