![]()
從寫代碼到「接管電腦」,GPT-5.3-Codex 正在重新定義什么叫 AI 工具人。
作者|樺林舞王
編輯|靖宇
2 月 5 日,Anthropic 在超級碗上發(fā)布的諷刺廣告,,卻被科技圈嘲笑。
現(xiàn)在,Altman 的報復來了!
當?shù)貢r間 2 月 5 日,OpenAI 發(fā)布 GPT-5.3-Codex,這款最新的代碼模型不僅在測試中名列前茅,而且能真正接管電腦,自主切換程序,完成復雜任務。
,現(xiàn)在又是 GPT-5.3-Codex,來自 Altman 的反擊,是如此迅速。
01
從「代碼助手」到「電腦管家」
傳統(tǒng)的 AI 編程工具,包括 GitHub Copilot 和之前的 Codex,本質(zhì)上都是「代碼補全器」——你寫一行,它幫你寫下一行。但 GPT-5.3-Codex 完全不同。
它能「接管」你的整臺電腦。
OpenAI 在發(fā)布會上展示的場景讓人印象深刻:Codex 不僅能寫代碼,還能運行測試、調(diào)試程序、管理數(shù)據(jù)庫、處理文件系統(tǒng),甚至能夠自主地在不同應用程序之間切換,完成復雜的多步驟任務。
一位 Hacker News 用戶的觀察很有意思:「Codex 在發(fā)現(xiàn)錯誤和小的不一致性方面非常出色,這讓我感到驚訝。Claude Code 在『原始編程』方面很好,但 Codex 在仔細、系統(tǒng)地發(fā)現(xiàn)『問題』方面是無敵的。」
說白了,這不再是一個編程工具,而是一個數(shù)字員工。
相比于之前的版本,GPT-5.3-Codex 的提升不再僅僅體現(xiàn)在代碼生成的正確率,而是在「智能代理(Agentic)」能力上的質(zhì)變。
![]()
5.3 Codex 和自家產(chǎn)品的對比|圖片來源:OpenAI
在保持相同推理深度的情況下,運行速度比GPT-5.2-Codex快了25%。同時,新模型引入了「中途轉(zhuǎn)向(Mid-turn Steering)」。你不再需要等待模型生成完畢后才反饋,可以在它運行長達數(shù)小時的任務(如重構(gòu)整個代碼庫)時,隨時插入指令進行糾偏。
就在 OpenAI 發(fā)布 5.3 的同一天(甚至只相差 15 分鐘),Anthropic 發(fā)布了Claude Opus 4.6,火藥味極濃。
![]()
OpenAI 和 Anthropic 最新代碼模型的數(shù)據(jù)對比|圖片來源:AI 自制
更有趣的是,這是OpenAI第一個「自己造自己」的模型。
研究團隊用 Codex 來監(jiān)控訓練過程、分析代碼質(zhì)量、提出優(yōu)化建議。AI 開始參與 AI 的誕生過程,這個循環(huán)一旦形成,進化速度將是指數(shù)級的。
02
90% 時間在編程的產(chǎn)品經(jīng)理
最能說明 Codex 影響力的,不是技術(shù)指標,而是人的工作方式改變。
OpenAI 產(chǎn)品設計負責人 Ed Bayes 的話很直接:「我現(xiàn)在 90% 的時間都在編程。一年前正好相反,可能只有 10% 的時間。」
一個產(chǎn)品設計師,現(xiàn)在大部分時間在寫代碼——這個轉(zhuǎn)變背后的邏輯很簡單:當 AI 能夠理解你的意圖并直接實現(xiàn)時,傳統(tǒng)的「產(chǎn)品-開發(fā)-測試」流水線就被壓縮了。
這種變化不只發(fā)生在 OpenAI 內(nèi)部。
![]()
兩天前 OpenAI 剛剛發(fā)布 MacOS 版的 Codex 獨立應用|圖片來源:OpenAI
The New Stack 分析師指出:「GPT-5.3-Codex 不僅僅在單個任務上更好,而是朝著能夠在現(xiàn)實世界技術(shù)工作的全譜中進行推理、構(gòu)建和執(zhí)行的單一通用代理邁出了一步。」
但這也帶來了新的分工模式。
一位 Hacker News 用戶總結(jié)了 Codex 與 Anthropic Claude 的區(qū)別:「在 Codex 中,定位是一個交互式協(xié)作者:你在執(zhí)行過程中引導它,保持循環(huán),在它工作時糾正方向。而在 Opus 4.6 中,強調(diào)的是相反的:一個更自主、更智能、更深思熟慮的系統(tǒng)。」
這意味著,程序員的角色正在從「執(zhí)行者」轉(zhuǎn)向「指揮者」。
03
AI Coding 大戰(zhàn)升級
Codex 的發(fā)布時間點很微妙——就在超級碗前夕,OpenAI 和 Anthropic 都準備了競爭性廣告。VentureBeat 將此次發(fā)布描述為「AI 編程戰(zhàn)爭的開場齊射」。
這不是偶然。當 AI 編程工具從「錦上添花」變成「必需品」時,這個市場的競爭就會變得異常激烈。
有 Hacker News 評論員直接警告 Anthropic:「他們最好采取重大行動,否則 OpenAI 將殺死 Claude Code。」話雖然說得直接,但反映了業(yè)內(nèi)的普遍判斷:Codex 這次的能力躍升,確實給競爭對手帶來了巨大壓力。
不過,Every.to 的對比測試顯示了另一個角度:「在一項調(diào)試測試中,GPT-5.3 Codex 運行了超過 8 個工具調(diào)用,逐位分析但錯過了實際問題。而 Opus 4.6 只讀了一次文檔就診斷出了問題。」
這說明,不同的 AI 編程工具正在形成差異化的優(yōu)勢:Codex 更像一個細致的執(zhí)行者,Claude 更像一個敏銳的診斷師。
但無論如何,Sam Altman 的評價很能說明問題:「感覺,比基準測試顯示的更像是一個真正的進步。」當CEO用「感覺」而不是數(shù)據(jù)來描述產(chǎn)品時,往往意味著這個產(chǎn)品已經(jīng)超越了現(xiàn)有的評估體系。
這場 AI 編程戰(zhàn)爭,本質(zhì)上是在爭奪一個問題的答案:在軟件開發(fā)這個萬億美元市場中,人和 AI 的邊界到底在哪里?
Codex 給出的答案是:AI 可以做程序員能做的幾乎所有事情,人類負責告訴 AI 要做什么。這個分工模式一旦被驗證,整個軟件行業(yè)的人才需求、薪酬結(jié)構(gòu)、甚至教育體系都會發(fā)生根本性改變。
現(xiàn)在的問題不再是「AI 會不會取代程序員」,而是「什么樣的程序員,不會被 AI 取代」。
*頭圖來源:OpenAI
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO
極客一問
你怎么看 OpenAI 發(fā)布的最新代碼模型?
![]()
馬斯克曝光,蘋果造車時挖角特斯拉,雙倍工資免面試。
點贊關(guān)注極客公園視頻號,
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.