網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

奧特曼真急了！硅谷一夜兩彈! GPT-5.3-Codex狙擊Claude 4.6

2026-02-06 20:49:27　來(lái)源: 互聯(lián)網(wǎng)思想

廣東舉報(bào)

分享至

硅谷一夜兩彈! GPT-5.3-Codex狙擊Claude 4.6, 奧特曼真急了

來(lái)源：新智元

編輯：好困桃子

【導(dǎo)讀】一天之內(nèi)，兩大編程AI輪番轟炸硅谷。Claude Opus 4.6之后，奧特曼緊急放出GPT-5.3-Codex。雙雄爭(zhēng)霸，徹底撕開(kāi)AI王座爭(zhēng)奪戰(zhàn)的帷幕。

硅谷今夜難眠！

Claude Opus 4.6毫無(wú)征兆地深夜突襲，沒(méi)想到，卻讓奧特曼措手不及。

作為回應(yīng)，OpenAI倉(cāng)促應(yīng)戰(zhàn)，不過(guò)半小時(shí)緊急祭出最強(qiáng)智能體編程模型——GPT-5.3-Codex。

沒(méi)有GPT-5.3，只有GPT-5.3-Codex！

它完美融合了GPT-5.2-Codex頂尖編程能力與GPT-5.2卓越的推理及專業(yè)知識(shí)能力，且運(yùn)行速度更提升了25%。

那些涉及深度研究、工具調(diào)用及復(fù)雜執(zhí)行的長(zhǎng)程任務(wù)，都能夠輕松駕馭。

GPT-5.3-Codex就像一位并肩作戰(zhàn)的同事，你可以在它工作時(shí)進(jìn)行實(shí)時(shí)引導(dǎo)和互動(dòng)，且完全無(wú)需擔(dān)心上下文丟失。

值得一提的是，GPT-5.3-Codex還是首個(gè)在自身創(chuàng)造過(guò)程中發(fā)揮了關(guān)鍵作用的模型。

隨著GPT-5.3-Codex的問(wèn)世，Codex的角色發(fā)生了質(zhì)的飛躍：

從一個(gè)只會(huì)編寫(xiě)和審查代碼的AI智能體，進(jìn)化為一個(gè)幾乎能完成開(kāi)發(fā)者和專業(yè)人士在計(jì)算機(jī)上能做的任何事情的AI智能體。

GPT-5.3-Codex現(xiàn)已加入ChatGPT付費(fèi)計(jì)劃，覆蓋Codex所有應(yīng)用場(chǎng)景：App、CLI、IDE擴(kuò)展及Web端。

如今，整個(gè)硅谷成為了Anthropic和OpenAI雙雄決戰(zhàn)的「修羅場(chǎng)」，空氣中都充滿了火藥味兒。

有趣的是，原本奧特曼在凌晨12點(diǎn)預(yù)告了新模型發(fā)布，卻讓Anthropic搶占了發(fā)布的先機(jī)。

一夜之間，兩大最強(qiáng)編程AI懟臉PK，網(wǎng)友們紛紛吐槽，「簡(jiǎn)直跟不上AI迭代的速度了」。

GPT-5.3-Codex登場(chǎng)，編碼更強(qiáng)了

GPT-5.3-Codex實(shí)力有多強(qiáng)，亮一亮成績(jī)單就知道了。

軟件工程新SOTA

GPT-5.3-Codex在評(píng)估現(xiàn)實(shí)世界軟件工程的SWE-Bench Pro評(píng)測(cè)中，創(chuàng)下了行業(yè)新高。

與此同時(shí)，在衡量編程智能體終端技能的Terminal-Bench 2.0中，它的表現(xiàn)也遠(yuǎn)超此前的SOTA。

值得一提的是，GPT-5.3-Codex實(shí)現(xiàn)這一切所消耗的Token，比以往任何模型都要少得多。

相較于只測(cè)試Python的SWE-bench Verified，SWE-Bench Pro涵蓋四種語(yǔ)言，不僅更能抵御數(shù)據(jù)污染，也更具挑戰(zhàn)性、多樣性和行業(yè)相關(guān)性

從0造出游戲

結(jié)合前沿的編程能力、美學(xué)和緊湊性的改進(jìn)，GPT-5.3-Codex能產(chǎn)出驚人的成果，甚至能在幾天內(nèi)從零開(kāi)始構(gòu)建功能高度復(fù)雜的各類游戲和應(yīng)用。

為了測(cè)試該模型的Web開(kāi)發(fā)和長(zhǎng)程智能體能力，OpenAI讓GPT-5.3-Codex做了兩款游戲：

Codex App發(fā)布時(shí)的賽車游戲第二版，以及一款潛水游戲。

利用開(kāi)發(fā)Web游戲的技能以及預(yù)先選好的通用后續(xù)提示詞（比如「修復(fù)bug」或「改進(jìn)游戲」），GPT-5.3-Codex在數(shù)百萬(wàn)個(gè)Token的交互中，自主對(duì)游戲進(jìn)行了迭代。

賽車游戲：包含不同的賽車手、八張地圖，甚至還有可以用空格鍵觸發(fā)的道具

潛水游戲：玩家可以在其中探索各種珊瑚礁，收集它們以完成你的魚(yú)類圖鑒，同時(shí)還要管理氧氣

· 更懂你的意圖

相比GPT-5.2-Codex，當(dāng)你讓GPT-5.3-Codex制作日常網(wǎng)站時(shí)，它能更精準(zhǔn)地理解你的意圖。

對(duì)于簡(jiǎn)單或描述模糊的提示詞，它現(xiàn)在默認(rèn)會(huì)生成功能更豐富、設(shè)置更合理的網(wǎng)站，為你提供更優(yōu)質(zhì)的起步畫(huà)布，助力創(chuàng)意落地。

·GPT-5.3-Codex vs GPT-5.2-Codex

舉個(gè)例子，同時(shí)要求GPT-5.3-Codex和GPT-5.2-Codex構(gòu)建落地頁(yè)。

GPT-5.3-Codex會(huì)自動(dòng)將年度計(jì)劃顯示為折算后的月付價(jià)格，讓折扣看起來(lái)清晰且經(jīng)過(guò)精心設(shè)計(jì)，而不是簡(jiǎn)單地算出年度總額。

此外，它還制作了一個(gè)包含三條不同用戶引語(yǔ)的自動(dòng)切換證言輪播，而非單調(diào)的一條。這使得頁(yè)面默認(rèn)看起來(lái)更完整，更像是一個(gè)可以直接上線的產(chǎn)品。

GPT-5.3-Codex

GPT-5.2-Codex

提示詞：

為Quiet KPI構(gòu)建一個(gè)落地頁(yè)，這是一個(gè)對(duì)創(chuàng)始人友好的每周指標(biāo)摘要。美學(xué)風(fēng)格采用柔和的SaaS風(fēng)，玻璃質(zhì)感卡片，薰衣草色到藍(lán)色的漸變，微妙的模糊效果。板塊包括：帶有郵箱收集的首屏，示例報(bào)告卡片網(wǎng)格，集成列表行，客戶證言輪播，月付/年付價(jià)格切換，常見(jiàn)問(wèn)題解答，頁(yè)腳。

· 字體使用Satoshi或類似的幾何無(wú)襯線字體。

· 按鈕采用圓角，14px半徑，強(qiáng)烈的聚焦?fàn)顟B(tài)。

· 添加一個(gè)有品位的基于滾動(dòng)的顯現(xiàn)效果。

超越編程的通用能力

軟件工程師、設(shè)計(jì)師、產(chǎn)品經(jīng)理和數(shù)據(jù)科學(xué)家所做的工作遠(yuǎn)不止生成代碼。

GPT-5.3-Codex不僅為軟件生命周期中的所有環(huán)節(jié)，如調(diào)試、部署、監(jiān)控、編寫(xiě)PRD、編輯文案、用戶研究、測(cè)試、指標(biāo)等提供了支持。

而且，它還能幫用戶構(gòu)建任何想做的東西——不管是制作精美的幻燈片，還是在表格里進(jìn)行復(fù)雜的數(shù)據(jù)分析。

在衡量專業(yè)知識(shí)工作的GDPval中，GPT-5.3-Codex表現(xiàn)出色，與GPT-5.2處于同一頂尖水平。

1. 財(cái)務(wù)建議幻燈片

2. 零售培訓(xùn)文檔

3. NPV分析電子表格

4. 時(shí)尚演示PDF

· 計(jì)算機(jī)使用能力

OSWorld是一個(gè)關(guān)于計(jì)算機(jī)使用的基準(zhǔn)測(cè)試，要求智能體在可視化的桌面計(jì)算機(jī)環(huán)境中完成生產(chǎn)力任務(wù)。

在這里，GPT-5.3-Codex展現(xiàn)出遠(yuǎn)超之前GPT模型的計(jì)算機(jī)操作能力。

在OSWorld-Verified中，模型使用視覺(jué)來(lái)完成各種計(jì)算機(jī)任務(wù)（人類得分約為72%）

總之，這些在編程、前端、計(jì)算機(jī)操作和現(xiàn)實(shí)世界任務(wù)中的優(yōu)異表現(xiàn)表明，GPT-5.3-Codex不僅在單項(xiàng)任務(wù)上表現(xiàn)更好，更是向單一通用智能體邁出的跨越性一步。

這意味著智能體已能夠在全方位的現(xiàn)實(shí)世界技術(shù)工作中進(jìn)行推理、構(gòu)建和執(zhí)行。

協(xié)同作戰(zhàn)，還能中途喊停

隨著模型能力越來(lái)越強(qiáng)，現(xiàn)在的挑戰(zhàn)已經(jīng)從「智能體能做什么」，變成了「人類如何輕松地與并行工作的多個(gè)智能體進(jìn)行交互、指揮和監(jiān)督」。

在GPT-5.3-Codex的加持下，操作過(guò)程的更新也會(huì)更加頻繁。

這樣，開(kāi)發(fā)者就可以在它工作時(shí)隨時(shí)掌握關(guān)鍵決策和進(jìn)。

你不必干等著最終結(jié)果，而是可以實(shí)時(shí)交互——提問(wèn)、討論方法，并引導(dǎo)它走向解決方案。

GPT-5.3-Codex會(huì)把它的操作講給你聽(tīng)，響應(yīng)你的反饋，并讓你從頭到尾都全程同步。

自我加速迭代，接管研發(fā)工作流

現(xiàn)在的Codex，懂你意圖，更懂效率。

OpenAI內(nèi)部甚至出現(xiàn)了一種「套娃」式的進(jìn)化：Codex正在加速Codex的誕生。

短短兩個(gè)月，OpenAI的研究員和工程師們發(fā)現(xiàn)，工作方式已被徹底顛覆。

他們正在用GPT-5.3-Codex的早期版本，去訓(xùn)練、部署和優(yōu)化現(xiàn)在的正式版。

這一波「自我進(jìn)化」的實(shí)戰(zhàn)成績(jī)，相當(dāng)炸裂：

研究團(tuán)隊(duì)
從監(jiān)控訓(xùn)練運(yùn)行、深挖交互模式，到給人類同事開(kāi)發(fā)分析工具，Codex全程參與，不僅修Bug，還能提建議。
工程團(tuán)隊(duì)
它是最硬核的戰(zhàn)友。無(wú)論是優(yōu)化測(cè)試框架、定位緩存失效的根源，還是在流量洪峰中動(dòng)態(tài)調(diào)度GPU集群，它都穩(wěn)得住。
Alpha測(cè)試實(shí)戰(zhàn)
為了搞懂生產(chǎn)力差異，Codex自己寫(xiě)正則分類器，跑遍海量日志，直接甩出一份精準(zhǔn)報(bào)告。
面對(duì)反直覺(jué)數(shù)據(jù)，它聯(lián)手?jǐn)?shù)據(jù)科學(xué)家構(gòu)建新管道。人類需要幾小時(shí)？Codex只用了三分鐘，就從數(shù)千個(gè)數(shù)據(jù)點(diǎn)中提煉出了關(guān)鍵洞察。

不止編程，更是全能操盤(pán)手

GPT-5.3-Codex的野心，早已溢出了代碼框。

隨著這次發(fā)布，Codex也開(kāi)始從單純的寫(xiě)代碼工具，轉(zhuǎn)型為操作計(jì)算機(jī)并端到端完成工作的得力助手。

OpenAI正在解鎖更廣闊的戰(zhàn)場(chǎng)——從構(gòu)建軟件，到深度研究、復(fù)雜分析，乃至執(zhí)行一切案頭工作。

曾經(jīng)，它的目標(biāo)是做「最強(qiáng)編程智能體」；現(xiàn)在，它是你電腦里無(wú)所不能的「通用協(xié)作者」。

Codex的適用邊界被無(wú)限拓寬，而我們創(chuàng)造力的天花板，也將被徹底重寫(xiě)。

參考資料：

https://openai.com/index/introducing-gpt-5-3-codex/

https://x.com/OpenAI/status/2019474152743223477

https://x.com/sama/status/2019474754529321247

為偉大思想而生！

AI+時(shí)代，互聯(lián)網(wǎng)思想（wanging0123)，

第一必讀自媒體

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.