網易首頁 > 網易號 > 正文申請入駐

最強智能體編程模型！OpenAI重磅發布GPT-5.2 Codex

2025-12-19 12:04:56　來源: CSDN

北京舉報

分享至

整理 | 蘇宓

出品 | CSDN（ID：CSDNnews）

當下，各家 AI 模型的能力還在你追我趕地往上「卷」，尤其是在編碼領域。

就在今天，OpenAI 發布了智能體編程模型 Codex 的新版本——GPT-5.2 Codex，目標很直接：把更復雜、更耗時的軟件工程工作，盡量交給 AI 來完成。

按照 OpenAI 的說法，GPT-5.2 Codex 是在 GPT-5.2 能力基礎上的一次“強化升級”，重點補齊了幾個工程里常見的痛點：長上下文處理、大規模代碼重構、Windows 環境下的開發體驗，以及網絡安全相關能力。

從模型基準測試結果來看，這次更新也不只是“小修小補”。

更強的 GPT-5.2 Codex 來了

在衡量真實軟件工程能力的 SWE-Bench Pro 測試中，GPT-5.2 Codex 拿下了 56.4% 的準確率，刷新了該基準的最高紀錄，超過了目前已發布的其他編程模型。這一基準下，GPT-5.2 獲得了 55.6% 的準確率，GPT-5.1 僅有 50.8%。

在 Terminal-Bench 2.0 中，它的成績也達到了 64%，超過了 GPT-5.2 的 62.2% 和 GPT-5.1-Codex-Max 的 58.1%，該測試評估了智能體在真實終端環境下進行編譯、訓練和服務器配置的能力。

同時，模型的視覺能力也更強了，能更好地看懂屏幕截圖、技術圖表和用戶界面，可以直接把設計稿轉成可運行的原型。

OpenAI 在博客中反復強調，GPT-5.2 Codex 的核心目標是推動“軟件工程”，而不僅僅是寫幾段代碼。在工程實踐中，設計、開發、測試、維護缺一不可，最終追求的是穩定、可靠、好維護、還能不斷演進的軟件。

在這些環節里，GPT-5.2 Codex 尤其擅長的一項能力是代碼重構。簡單說，就是在不加新功能的前提下，把代碼寫得更干凈、更高效。OpenAI 舉例稱，這個模型可以調整代碼結構，降低內存占用，或者讓應用響應更快——這些往往是工程師最不想、但又不得不花時間做的事情。

從演進路線來看，GPT-5.2 Codex 也不是憑空出現的。在它之前，GPT-5-Codex、GPT-5.1-Codex-Max 已經在多步推理、長上下文理解，以及和開發工具協作方面持續打磨，而 5.2 版本正是在這些積累之上繼續往前推了一步。

比如，得益于上下文壓縮能力，GPT-5.2 Codex 在長時間、跨步驟的編程任務中更不容易“忘事”，能把復雜流程一口氣跑完；在大規模代碼庫中，它對重構、遷移和新功能構建的支持也更成熟。此外，Windows 環境下的編程體驗有所提升，并加入了更高級的安全能力，用于輔助漏洞發現、測試和緩解。

安全性進一步提升

除此之外，OpenAI 也特別提到，安全性是 AI 參與軟件工程時繞不開的一環。企業級系統對穩定性和可靠性的要求極高，開發和安全團隊在修復復雜漏洞時，既需要 AI 的幫助，也必須確保這些工具本身不會帶來新的安全隱患。

這一次，在專業級 Capture-the-Flag（CTF）挑戰賽中的 pass@12 成績遠超前幾代模型，如 o3、GPT-5 和 GPT-5.1-Codex-Max。從 2025 年 4 月到 2026 年 1 月的走勢圖來看，它的能力呈指數級增長，但仍低于 OpenAI 定義的“高等級準備框架”門檻，因此官方在系統說明中設置了多層安全防護。

事實上，Codex 在安全方向上的潛力已經有過實際案例。本月早些時候，安全研究員 Andrew MacPherson 使用 GPT-5.1-Codex-Max 分析了 React 的一個漏洞（CVE-2025-55182）。他在博客中提到，模型通過多輪評估、模糊測試和漏洞利用分析相結合的方式，不僅幫助緩解了問題，還意外發現并修復了此前未被注意到的漏洞。

在 OpenAI 看來，GPT-5.2 Codex 的這些改進，能在現實中給企業帶來直接價值：把最復雜、最重復的軟件工程任務自動化，同時支持更復雜功能和更高等級的安全需求，幫助團隊提高效率、減少人為失誤，在激烈的工程競爭中保持優勢。

這個模型是在競爭越來越激烈的情況下推出的。此前，OpenAI 內部就曾因為 Google 的 Gemini 3 進展而啟動“紅色警報”應對。GPT-5.2-Codex 可以在命令行工具（CLI）、IDE 插件、網頁端、移動端以及 GitHub 代碼審查中使用。

在發布節奏上，OpenAI 表示 GPT-5.2 Codex 即日起向所有付費 ChatGPT 用戶開放。接下來一段時間，訪問權限將擴展至 API 用戶，同時還會推出一個僅限邀請的可信訪問試點，面向經過審核、專注于防御型網絡安全的安全專業人士。

更多關于 GPT-5.2 Codex 詳見：https://openai.com/zh-Hans-CN/index/introducing-gpt-5-2-codex/

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.