![]()
哈嘍,大家好,今天小睿這篇評(píng)論,主要來分析 GPT-5.2 性能狂飆卻未解紅色警報(bào),漲價(jià) + 競(jìng)爭(zhēng)讓 OpenAI 陷博弈
AI 圈又炸鍋了,OpenAI 時(shí)隔一個(gè)月就推出 GPT-5.2,數(shù)學(xué)競(jìng)賽拿滿分、專業(yè)能力超專家,性能提升堪稱逆天。
但這款強(qiáng)勢(shì)新品,卻沒解除 OpenAI 此前拉響的紅色警報(bào),漲價(jià)策略還引來不少爭(zhēng)議,背后的競(jìng)爭(zhēng)博弈遠(yuǎn)比想象中激烈。
![]()
GPT-5.2 的性能提升確實(shí)讓人驚艷,在 AIME 2025 數(shù)學(xué)競(jìng)賽中直接拿下 100% 滿分,要知道這可是難度遠(yuǎn)超高中數(shù)學(xué)的賽事。
![]()
在 FrontierMath 測(cè)試中,它還解決了 40.3% 的專家級(jí)數(shù)學(xué)難題,不少專業(yè)數(shù)學(xué)家都要花費(fèi)大量時(shí)間鉆研這些題目。
專業(yè)工作領(lǐng)域更是表現(xiàn)突出,在涵蓋 44 種職業(yè)的 GDPval 基準(zhǔn)測(cè)試中,70.9% 的情況下能擊敗或打平頂尖行業(yè)專家,完成速度是人類的 11 倍以上,成本卻不到 1%。
北京一家科技公司的開發(fā)者分享,他們用 GPT-5.2 Thinking 開發(fā)一款含 3D 效果的前端應(yīng)用,只輸入一條提示,模型就生成了完整代碼,還自動(dòng)修復(fù)了 3 處潛在 bug,原本需要一周的工作量,兩天就完成了。
![]()
GPT-5.2 Pro 在 ARC-AGI-1 測(cè)試中實(shí)現(xiàn) 390 倍效率提升,單任務(wù)成本從 4500 美元降至 11.64 美元,準(zhǔn)確率還提升到 90.5%。
![]()
在 GitHub 維護(hù)的 NYT Connections 測(cè)試中,GPT-5.2 高推理模式下準(zhǔn)確率僅 77.9%,排名第 11 位,而谷歌 Gemini 3 Pro Preview 以 96.8% 的準(zhǔn)確率位居第一,xAI 的 Grok 4.1 也達(dá)到 93.5%。
![]()
此外,Anthropic 的 Claude 4.5 還大幅降價(jià),輸入每百萬 token 5 美元、輸出 25 美元,降幅約 2/3,價(jià)格優(yōu)勢(shì)相當(dāng)明顯。
性能提升的同時(shí),GPT-5.2 的定價(jià)也同步上漲,API 層面每百萬輸入 token 1.75 美元、輸出 14 美元,較前代貴了 40%。
![]()
GPT-5.2 Pro 更貴,每百萬輸入 21 美元、輸出 168 美元,還首次支持第五檔推理強(qiáng)度 xhigh。
反觀競(jìng)爭(zhēng)對(duì)手,Gemini 3 Pro 提示詞≤20 萬 token 時(shí),輸入每百萬 token 2 美元、輸出 12 美元,Claude 4.5 更是大幅降價(jià),性價(jià)比差距瞬間拉開。
上海一位做 AI 工具開發(fā)的創(chuàng)業(yè)者表示,他們之前一直用 GPT 系列 API,GPT-5.2 漲價(jià)后,每月成本要增加近 3 萬元,已經(jīng)開始測(cè)試 Claude 4.5,發(fā)現(xiàn)核心功能差距不大,成本卻能節(jié)省一半。
![]()
還有不少中小開發(fā)者在社交平臺(tái)反饋,OpenAI 的高價(jià)策略讓他們難以承受,正在逐步轉(zhuǎn)向價(jià)格更親民的競(jìng)品。
![]()
GPT-5.2 的性能突破展現(xiàn)了 AI 技術(shù)的強(qiáng)大潛力,但行業(yè)競(jìng)爭(zhēng)已進(jìn)入白熱化階段。
無論是技術(shù)短板的彌補(bǔ),還是商業(yè)策略的調(diào)整,都考驗(yàn)著 OpenAI 的應(yīng)對(duì)能力,良性競(jìng)爭(zhēng)終將推動(dòng)行業(yè)進(jìn)步,最終受益的還是廣大用戶。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.