
整理 | 蘇宓
出品 | CSDN(ID:CSDNnews)
當下,各家 AI 模型的能力還在你追我趕地往上「卷」,尤其是在編碼領域。
就在今天,OpenAI 發布了智能體編程模型 Codex 的新版本——GPT-5.2 Codex,目標很直接:把更復雜、更耗時的軟件工程工作,盡量交給 AI 來完成。
按照 OpenAI 的說法,GPT-5.2 Codex 是在 GPT-5.2 能力基礎上的一次“強化升級”,重點補齊了幾個工程里常見的痛點:長上下文處理、大規模代碼重構、Windows 環境下的開發體驗,以及網絡安全相關能力。
從模型基準測試結果來看,這次更新也不只是“小修小補”。
![]()
![]()
更強的 GPT-5.2 Codex 來了
在衡量真實軟件工程能力的 SWE-Bench Pro 測試中,GPT-5.2 Codex 拿下了 56.4% 的準確率,刷新了該基準的最高紀錄,超過了目前已發布的其他編程模型。這一基準下,GPT-5.2 獲得了 55.6% 的準確率,GPT-5.1 僅有 50.8%。
在 Terminal-Bench 2.0 中,它的成績也達到了 64%,超過了 GPT-5.2 的 62.2% 和 GPT-5.1-Codex-Max 的 58.1%,該測試評估了智能體在真實終端環境下進行編譯、訓練和服務器配置的能力。
同時,模型的視覺能力也更強了,能更好地看懂屏幕截圖、技術圖表和用戶界面,可以直接把設計稿轉成可運行的原型。
![]()
OpenAI 在博客中反復強調,GPT-5.2 Codex 的核心目標是推動“軟件工程”,而不僅僅是寫幾段代碼。在工程實踐中,設計、開發、測試、維護缺一不可,最終追求的是穩定、可靠、好維護、還能不斷演進的軟件。
在這些環節里,GPT-5.2 Codex 尤其擅長的一項能力是代碼重構。簡單說,就是在不加新功能的前提下,把代碼寫得更干凈、更高效。OpenAI 舉例稱,這個模型可以調整代碼結構,降低內存占用,或者讓應用響應更快——這些往往是工程師最不想、但又不得不花時間做的事情。
從演進路線來看,GPT-5.2 Codex 也不是憑空出現的。在它之前,GPT-5-Codex、GPT-5.1-Codex-Max 已經在多步推理、長上下文理解,以及和開發工具協作方面持續打磨,而 5.2 版本正是在這些積累之上繼續往前推了一步。
比如,得益于上下文壓縮能力,GPT-5.2 Codex 在長時間、跨步驟的編程任務中更不容易“忘事”,能把復雜流程一口氣跑完;在大規模代碼庫中,它對重構、遷移和新功能構建的支持也更成熟。此外,Windows 環境下的編程體驗有所提升,并加入了更高級的安全能力,用于輔助漏洞發現、測試和緩解。
![]()
安全性進一步提升
除此之外,OpenAI 也特別提到,安全性是 AI 參與軟件工程時繞不開的一環。企業級系統對穩定性和可靠性的要求極高,開發和安全團隊在修復復雜漏洞時,既需要 AI 的幫助,也必須確保這些工具本身不會帶來新的安全隱患。
這一次,在專業級 Capture-the-Flag(CTF)挑戰賽中的 pass@12 成績遠超前幾代模型,如 o3、GPT-5 和 GPT-5.1-Codex-Max。從 2025 年 4 月到 2026 年 1 月的走勢圖來看,它的能力呈指數級增長,但仍低于 OpenAI 定義的“高等級準備框架”門檻,因此官方在系統說明中設置了多層安全防護。
![]()
事實上,Codex 在安全方向上的潛力已經有過實際案例。本月早些時候,安全研究員 Andrew MacPherson 使用 GPT-5.1-Codex-Max 分析了 React 的一個漏洞(CVE-2025-55182)。他在博客中提到,模型通過多輪評估、模糊測試和漏洞利用分析相結合的方式,不僅幫助緩解了問題,還意外發現并修復了此前未被注意到的漏洞。
在 OpenAI 看來,GPT-5.2 Codex 的這些改進,能在現實中給企業帶來直接價值:把最復雜、最重復的軟件工程任務自動化,同時支持更復雜功能和更高等級的安全需求,幫助團隊提高效率、減少人為失誤,在激烈的工程競爭中保持優勢。
這個模型是在競爭越來越激烈的情況下推出的。此前,OpenAI 內部就曾因為 Google 的 Gemini 3 進展而啟動“紅色警報”應對。GPT-5.2-Codex 可以在命令行工具(CLI)、IDE 插件、網頁端、移動端以及 GitHub 代碼審查中使用。
在發布節奏上,OpenAI 表示 GPT-5.2 Codex 即日起向所有付費 ChatGPT 用戶開放。接下來一段時間,訪問權限將擴展至 API 用戶,同時還會推出一個僅限邀請的可信訪問試點,面向經過審核、專注于防御型網絡安全的安全專業人士。
更多關于 GPT-5.2 Codex 詳見:https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2-codex/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.