網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

被對手懟暴后，OpenAI 發(fā)布最強代碼模型

2026-02-06 11:50:11　來源: 極客公園

北京舉報

分享至

從寫代碼到「接管電腦」，GPT-5.3-Codex 正在重新定義什么叫 AI 工具人。

作者｜樺林舞王

編輯｜靖宇

2 月 5 日，Anthropic 在超級碗上發(fā)布的諷刺廣告，，卻被科技圈嘲笑。

現(xiàn)在，Altman 的報復來了！

當?shù)貢r間 2 月 5 日，OpenAI 發(fā)布 GPT-5.3-Codex，這款最新的代碼模型不僅在測試中名列前茅，而且能真正接管電腦，自主切換程序，完成復雜任務。

，現(xiàn)在又是 GPT-5.3-Codex，來自 Altman 的反擊，是如此迅速。

從「代碼助手」到「電腦管家」

傳統(tǒng)的 AI 編程工具，包括 GitHub Copilot 和之前的 Codex，本質(zhì)上都是「代碼補全器」——你寫一行，它幫你寫下一行。但 GPT-5.3-Codex 完全不同。

它能「接管」你的整臺電腦。

OpenAI 在發(fā)布會上展示的場景讓人印象深刻：Codex 不僅能寫代碼，還能運行測試、調(diào)試程序、管理數(shù)據(jù)庫、處理文件系統(tǒng)，甚至能夠自主地在不同應用程序之間切換，完成復雜的多步驟任務。

一位 Hacker News 用戶的觀察很有意思：「Codex 在發(fā)現(xiàn)錯誤和小的不一致性方面非常出色，這讓我感到驚訝。Claude Code 在『原始編程』方面很好，但 Codex 在仔細、系統(tǒng)地發(fā)現(xiàn)『問題』方面是無敵的。」

說白了，這不再是一個編程工具，而是一個數(shù)字員工。

相比于之前的版本，GPT-5.3-Codex 的提升不再僅僅體現(xiàn)在代碼生成的正確率，而是在「智能代理（Agentic）」能力上的質(zhì)變。

5.3 Codex 和自家產(chǎn)品的對比｜圖片來源：OpenAI

在保持相同推理深度的情況下，運行速度比GPT-5.2-Codex快了25%。同時，新模型引入了「中途轉(zhuǎn)向（Mid-turn Steering）」。你不再需要等待模型生成完畢后才反饋，可以在它運行長達數(shù)小時的任務（如重構(gòu)整個代碼庫）時，隨時插入指令進行糾偏。

就在 OpenAI 發(fā)布 5.3 的同一天（甚至只相差 15 分鐘），Anthropic 發(fā)布了Claude Opus 4.6，火藥味極濃。

OpenAI 和 Anthropic 最新代碼模型的數(shù)據(jù)對比｜圖片來源：AI 自制

更有趣的是，這是OpenAI第一個「自己造自己」的模型。

研究團隊用 Codex 來監(jiān)控訓練過程、分析代碼質(zhì)量、提出優(yōu)化建議。AI 開始參與 AI 的誕生過程，這個循環(huán)一旦形成，進化速度將是指數(shù)級的。

90% 時間在編程的產(chǎn)品經(jīng)理

最能說明 Codex 影響力的，不是技術(shù)指標，而是人的工作方式改變。

OpenAI 產(chǎn)品設計負責人 Ed Bayes 的話很直接：「我現(xiàn)在 90% 的時間都在編程。一年前正好相反，可能只有 10% 的時間。」

一個產(chǎn)品設計師，現(xiàn)在大部分時間在寫代碼——這個轉(zhuǎn)變背后的邏輯很簡單：當 AI 能夠理解你的意圖并直接實現(xiàn)時，傳統(tǒng)的「產(chǎn)品-開發(fā)-測試」流水線就被壓縮了。

這種變化不只發(fā)生在 OpenAI 內(nèi)部。

兩天前 OpenAI 剛剛發(fā)布 MacOS 版的 Codex 獨立應用｜圖片來源：OpenAI

The New Stack 分析師指出：「GPT-5.3-Codex 不僅僅在單個任務上更好，而是朝著能夠在現(xiàn)實世界技術(shù)工作的全譜中進行推理、構(gòu)建和執(zhí)行的單一通用代理邁出了一步。」

但這也帶來了新的分工模式。

一位 Hacker News 用戶總結(jié)了 Codex 與 Anthropic Claude 的區(qū)別：「在 Codex 中，定位是一個交互式協(xié)作者：你在執(zhí)行過程中引導它，保持循環(huán)，在它工作時糾正方向。而在 Opus 4.6 中，強調(diào)的是相反的：一個更自主、更智能、更深思熟慮的系統(tǒng)。」

這意味著，程序員的角色正在從「執(zhí)行者」轉(zhuǎn)向「指揮者」。

AI Coding 大戰(zhàn)升級

Codex 的發(fā)布時間點很微妙——就在超級碗前夕，OpenAI 和 Anthropic 都準備了競爭性廣告。VentureBeat 將此次發(fā)布描述為「AI 編程戰(zhàn)爭的開場齊射」。

這不是偶然。當 AI 編程工具從「錦上添花」變成「必需品」時，這個市場的競爭就會變得異常激烈。

有 Hacker News 評論員直接警告 Anthropic：「他們最好采取重大行動，否則 OpenAI 將殺死 Claude Code。」話雖然說得直接，但反映了業(yè)內(nèi)的普遍判斷：Codex 這次的能力躍升，確實給競爭對手帶來了巨大壓力。

不過，Every.to 的對比測試顯示了另一個角度：「在一項調(diào)試測試中，GPT-5.3 Codex 運行了超過 8 個工具調(diào)用，逐位分析但錯過了實際問題。而 Opus 4.6 只讀了一次文檔就診斷出了問題。」

這說明，不同的 AI 編程工具正在形成差異化的優(yōu)勢：Codex 更像一個細致的執(zhí)行者，Claude 更像一個敏銳的診斷師。

但無論如何，Sam Altman 的評價很能說明問題：「感覺，比基準測試顯示的更像是一個真正的進步。」當CEO用「感覺」而不是數(shù)據(jù)來描述產(chǎn)品時，往往意味著這個產(chǎn)品已經(jīng)超越了現(xiàn)有的評估體系。

這場 AI 編程戰(zhàn)爭，本質(zhì)上是在爭奪一個問題的答案：在軟件開發(fā)這個萬億美元市場中，人和 AI 的邊界到底在哪里？

Codex 給出的答案是：AI 可以做程序員能做的幾乎所有事情，人類負責告訴 AI 要做什么。這個分工模式一旦被驗證，整個軟件行業(yè)的人才需求、薪酬結(jié)構(gòu)、甚至教育體系都會發(fā)生根本性改變。

現(xiàn)在的問題不再是「AI 會不會取代程序員」，而是「什么樣的程序員，不會被 AI 取代」。

*頭圖來源：OpenAI

本文為極客公園原創(chuàng)文章，轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO

極客一問

你怎么看 OpenAI 發(fā)布的最新代碼模型？

馬斯克曝光，蘋果造車時挖角特斯拉，雙倍工資免面試。

點贊關(guān)注極客公園視頻號，

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.