硅谷一夜兩彈! GPT-5.3-Codex狙擊Claude 4.6, 奧特曼真急了
![]()
來(lái)源:新智元
編輯:好困 桃子
【導(dǎo)讀】一天之內(nèi),兩大編程AI輪番轟炸硅谷。Claude Opus 4.6之后,奧特曼緊急放出GPT-5.3-Codex。雙雄爭(zhēng)霸,徹底撕開(kāi)AI王座爭(zhēng)奪戰(zhàn)的帷幕。
硅谷今夜難眠!
Claude Opus 4.6毫無(wú)征兆地深夜突襲,沒(méi)想到,卻讓奧特曼措手不及。
作為回應(yīng),OpenAI倉(cāng)促應(yīng)戰(zhàn),不過(guò)半小時(shí)緊急祭出最強(qiáng)智能體編程模型——GPT-5.3-Codex。
![]()
![]()
沒(méi)有GPT-5.3,只有GPT-5.3-Codex!
它完美融合了GPT-5.2-Codex頂尖編程能力與GPT-5.2卓越的推理及專業(yè)知識(shí)能力,且運(yùn)行速度更提升了25%。
![]()
那些涉及深度研究、工具調(diào)用及復(fù)雜執(zhí)行的長(zhǎng)程任務(wù),都能夠輕松駕馭。
GPT-5.3-Codex就像一位并肩作戰(zhàn)的同事,你可以在它工作時(shí)進(jìn)行實(shí)時(shí)引導(dǎo)和互動(dòng),且完全無(wú)需擔(dān)心上下文丟失。
值得一提的是,GPT-5.3-Codex還是首個(gè)在自身創(chuàng)造過(guò)程中發(fā)揮了關(guān)鍵作用的模型。
![]()
隨著GPT-5.3-Codex的問(wèn)世,Codex的角色發(fā)生了質(zhì)的飛躍:
從一個(gè)只會(huì)編寫(xiě)和審查代碼的AI智能體,進(jìn)化為一個(gè)幾乎能完成開(kāi)發(fā)者和專業(yè)人士在計(jì)算機(jī)上能做的任何事情的AI智能體。
![]()
GPT-5.3-Codex現(xiàn)已加入ChatGPT付費(fèi)計(jì)劃,覆蓋Codex所有應(yīng)用場(chǎng)景:App、CLI、IDE擴(kuò)展及Web端。
如今,整個(gè)硅谷成為了Anthropic和OpenAI雙雄決戰(zhàn)的「修羅場(chǎng)」,空氣中都充滿了火藥味兒。
有趣的是,原本奧特曼在凌晨12點(diǎn)預(yù)告了新模型發(fā)布,卻讓Anthropic搶占了發(fā)布的先機(jī)。
![]()
一夜之間,兩大最強(qiáng)編程AI懟臉PK,網(wǎng)友們紛紛吐槽,「簡(jiǎn)直跟不上AI迭代的速度了」。
![]()
![]()
GPT-5.3-Codex登場(chǎng),編碼更強(qiáng)了
GPT-5.3-Codex實(shí)力有多強(qiáng),亮一亮成績(jī)單就知道了。
![]()
軟件工程新SOTA
GPT-5.3-Codex在評(píng)估現(xiàn)實(shí)世界軟件工程的SWE-Bench Pro評(píng)測(cè)中,創(chuàng)下了行業(yè)新高。
與此同時(shí),在衡量編程智能體終端技能的Terminal-Bench 2.0中,它的表現(xiàn)也遠(yuǎn)超此前的SOTA。
值得一提的是,GPT-5.3-Codex實(shí)現(xiàn)這一切所消耗的Token,比以往任何模型都要少得多。
![]()
相較于只測(cè)試Python的SWE-bench Verified,SWE-Bench Pro涵蓋四種語(yǔ)言,不僅更能抵御數(shù)據(jù)污染,也更具挑戰(zhàn)性、多樣性和行業(yè)相關(guān)性
![]()
從0造出游戲
結(jié)合前沿的編程能力、美學(xué)和緊湊性的改進(jìn),GPT-5.3-Codex能產(chǎn)出驚人的成果,甚至能在幾天內(nèi)從零開(kāi)始構(gòu)建功能高度復(fù)雜的各類游戲和應(yīng)用。
為了測(cè)試該模型的Web開(kāi)發(fā)和長(zhǎng)程智能體能力,OpenAI讓GPT-5.3-Codex做了兩款游戲:
Codex App發(fā)布時(shí)的賽車游戲第二版,以及一款潛水游戲。
利用開(kāi)發(fā)Web游戲的技能以及預(yù)先選好的通用后續(xù)提示詞(比如「修復(fù)bug」或「改進(jìn)游戲」),GPT-5.3-Codex在數(shù)百萬(wàn)個(gè)Token的交互中,自主對(duì)游戲進(jìn)行了迭代。
![]()
賽車游戲:包含不同的賽車手、八張地圖,甚至還有可以用空格鍵觸發(fā)的道具
![]()
潛水游戲:玩家可以在其中探索各種珊瑚礁,收集它們以完成你的魚(yú)類圖鑒,同時(shí)還要管理氧氣
· 更懂你的意圖
相比GPT-5.2-Codex,當(dāng)你讓GPT-5.3-Codex制作日常網(wǎng)站時(shí),它能更精準(zhǔn)地理解你的意圖。
對(duì)于簡(jiǎn)單或描述模糊的提示詞,它現(xiàn)在默認(rèn)會(huì)生成功能更豐富、設(shè)置更合理的網(wǎng)站,為你提供更優(yōu)質(zhì)的起步畫(huà)布,助力創(chuàng)意落地。
·GPT-5.3-Codex vs GPT-5.2-Codex
舉個(gè)例子,同時(shí)要求GPT-5.3-Codex和GPT-5.2-Codex構(gòu)建落地頁(yè)。
GPT-5.3-Codex會(huì)自動(dòng)將年度計(jì)劃顯示為折算后的月付價(jià)格,讓折扣看起來(lái)清晰且經(jīng)過(guò)精心設(shè)計(jì),而不是簡(jiǎn)單地算出年度總額。
此外,它還制作了一個(gè)包含三條不同用戶引語(yǔ)的自動(dòng)切換證言輪播,而非單調(diào)的一條。這使得頁(yè)面默認(rèn)看起來(lái)更完整,更像是一個(gè)可以直接上線的產(chǎn)品。
![]()
GPT-5.3-Codex
![]()
GPT-5.2-Codex
提示詞:
為Quiet KPI構(gòu)建一個(gè)落地頁(yè),這是一個(gè)對(duì)創(chuàng)始人友好的每周指標(biāo)摘要。美學(xué)風(fēng)格采用柔和的SaaS風(fēng),玻璃質(zhì)感卡片,薰衣草色到藍(lán)色的漸變,微妙的模糊效果。板塊包括:帶有郵箱收集的首屏,示例報(bào)告卡片網(wǎng)格,集成列表行,客戶證言輪播,月付/年付價(jià)格切換,常見(jiàn)問(wèn)題解答,頁(yè)腳。
· 字體使用Satoshi或類似的幾何無(wú)襯線字體。
· 按鈕采用圓角,14px半徑,強(qiáng)烈的聚焦?fàn)顟B(tài)。
· 添加一個(gè)有品位的基于滾動(dòng)的顯現(xiàn)效果。
超越編程的通用能力
軟件工程師、設(shè)計(jì)師、產(chǎn)品經(jīng)理和數(shù)據(jù)科學(xué)家所做的工作遠(yuǎn)不止生成代碼。
GPT-5.3-Codex不僅為軟件生命周期中的所有環(huán)節(jié),如調(diào)試、部署、監(jiān)控、編寫(xiě)PRD、編輯文案、用戶研究、測(cè)試、指標(biāo)等提供了支持。
而且,它還能幫用戶構(gòu)建任何想做的東西——不管是制作精美的幻燈片,還是在表格里進(jìn)行復(fù)雜的數(shù)據(jù)分析。
在衡量專業(yè)知識(shí)工作的GDPval中,GPT-5.3-Codex表現(xiàn)出色,與GPT-5.2處于同一頂尖水平。
1. 財(cái)務(wù)建議幻燈片
![]()
![]()
2. 零售培訓(xùn)文檔
![]()
![]()
3. NPV分析電子表格
![]()
![]()
4. 時(shí)尚演示PDF
![]()
![]()
· 計(jì)算機(jī)使用能力
OSWorld是一個(gè)關(guān)于計(jì)算機(jī)使用的基準(zhǔn)測(cè)試,要求智能體在可視化的桌面計(jì)算機(jī)環(huán)境中完成生產(chǎn)力任務(wù)。
在這里,GPT-5.3-Codex展現(xiàn)出遠(yuǎn)超之前GPT模型的計(jì)算機(jī)操作能力。
![]()
在OSWorld-Verified中,模型使用視覺(jué)來(lái)完成各種計(jì)算機(jī)任務(wù)(人類得分約為72%)
總之,這些在編程、前端、計(jì)算機(jī)操作和現(xiàn)實(shí)世界任務(wù)中的優(yōu)異表現(xiàn)表明,GPT-5.3-Codex不僅在單項(xiàng)任務(wù)上表現(xiàn)更好,更是向單一通用智能體邁出的跨越性一步。
這意味著智能體已能夠在全方位的現(xiàn)實(shí)世界技術(shù)工作中進(jìn)行推理、構(gòu)建和執(zhí)行。
協(xié)同作戰(zhàn),還能中途喊停
隨著模型能力越來(lái)越強(qiáng),現(xiàn)在的挑戰(zhàn)已經(jīng)從「智能體能做什么」,變成了「人類如何輕松地與并行工作的多個(gè)智能體進(jìn)行交互、指揮和監(jiān)督」。
在GPT-5.3-Codex的加持下,操作過(guò)程的更新也會(huì)更加頻繁。
這樣,開(kāi)發(fā)者就可以在它工作時(shí)隨時(shí)掌握關(guān)鍵決策和進(jìn)。
你不必干等著最終結(jié)果,而是可以實(shí)時(shí)交互——提問(wèn)、討論方法,并引導(dǎo)它走向解決方案。
GPT-5.3-Codex會(huì)把它的操作講給你聽(tīng),響應(yīng)你的反饋,并讓你從頭到尾都全程同步。
![]()
自我加速迭代,接管研發(fā)工作流
現(xiàn)在的Codex,懂你意圖,更懂效率。
OpenAI內(nèi)部甚至出現(xiàn)了一種「套娃」式的進(jìn)化:Codex正在加速Codex的誕生。
短短兩個(gè)月,OpenAI的研究員和工程師們發(fā)現(xiàn),工作方式已被徹底顛覆。
他們正在用GPT-5.3-Codex的早期版本,去訓(xùn)練、部署和優(yōu)化現(xiàn)在的正式版。
這一波「自我進(jìn)化」的實(shí)戰(zhàn)成績(jī),相當(dāng)炸裂:
研究團(tuán)隊(duì)
從監(jiān)控訓(xùn)練運(yùn)行、深挖交互模式,到給人類同事開(kāi)發(fā)分析工具,Codex全程參與,不僅修Bug,還能提建議。
工程團(tuán)隊(duì)
它是最硬核的戰(zhàn)友。無(wú)論是優(yōu)化測(cè)試框架、定位緩存失效的根源,還是在流量洪峰中動(dòng)態(tài)調(diào)度GPU集群,它都穩(wěn)得住。
Alpha測(cè)試實(shí)戰(zhàn)
為了搞懂生產(chǎn)力差異,Codex自己寫(xiě)正則分類器,跑遍海量日志,直接甩出一份精準(zhǔn)報(bào)告。
面對(duì)反直覺(jué)數(shù)據(jù),它聯(lián)手?jǐn)?shù)據(jù)科學(xué)家構(gòu)建新管道。人類需要幾小時(shí)?Codex只用了三分鐘,就從數(shù)千個(gè)數(shù)據(jù)點(diǎn)中提煉出了關(guān)鍵洞察。
不止編程,更是全能操盤(pán)手
GPT-5.3-Codex的野心,早已溢出了代碼框。
隨著這次發(fā)布,Codex也開(kāi)始從單純的寫(xiě)代碼工具,轉(zhuǎn)型為操作計(jì)算機(jī)并端到端完成工作的得力助手。
OpenAI正在解鎖更廣闊的戰(zhàn)場(chǎng)——從構(gòu)建軟件,到深度研究、復(fù)雜分析,乃至執(zhí)行一切案頭工作。
曾經(jīng),它的目標(biāo)是做「最強(qiáng)編程智能體」; 現(xiàn)在,它是你電腦里無(wú)所不能的「通用協(xié)作者」。
Codex的適用邊界被無(wú)限拓寬,而我們創(chuàng)造力的天花板,也將被徹底重寫(xiě)。
參考資料:
https://openai.com/index/introducing-gpt-5-3-codex/
https://x.com/OpenAI/status/2019474152743223477
https://x.com/sama/status/2019474754529321247
![]()
為偉大思想而生!
AI+時(shí)代,互聯(lián)網(wǎng)思想(wanging0123),
第一必讀自媒體
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.