![]()
OpenAI集團公司今日發布了GPT-Codex的最新版本,這是一個智能體人工智能編碼模型,專門用于自動化復雜的軟件工程任務。
最新版本GPT-5.2-Codex在GPT-5.2的基礎上構建,增加了上下文壓縮、大規模代碼重構、Windows環境性能和網絡安全方面的改進。
根據OpenAI的博客文章,GPT-5.2-Codex在SWE-Bench Pro基準測試中取得了無與倫比的成績,準確率達到56.4%,超越了迄今為止發布的所有其他編碼模型。它在Terminal-Bench 2.0基準測試中也獲得了64%的分數,優于早期版本的Codex。該模型還得益于更強大的視覺能力,能夠更好地解讀屏幕截圖、技術圖表和用戶界面,從而將軟件設計原型轉化為功能原型。
OpenAI表示,GPT-5.2-Codex旨在推進軟件工程,軟件工程是通過將工程原理與編程知識相結合來設計、開發、測試和維護應用程序的過程。目標是創建高質量、可靠且可維護的軟件,能夠不斷演進以滿足用戶需求。
新模型處理耗時任務的能力使其特別擅長"重構",這是軟件工程的關鍵要素,涉及調整應用程序的代碼庫,不是為了添加新功能,而是為了提升其質量。例如,它可以調整應用程序的代碼庫以減少內存使用或提高響應速度。
GPT-5.2-Codex代表了OpenAI在生成式AI編碼能力方面多次迭代改進的成果。早期的模型如GPT-5-Codex和GPT-5.1-Codex-Max逐步改進了多步推理、長上下文理解和編碼環境中的工具集成等方面,而GPT-5.2-Codex在多個方面進一步發展。
OpenAI表示,由于其上下文壓縮能力,該模型在長期任務執行方面表現更佳,能夠進行持續的多步編碼任務而不會丟失上下文。在大規模代碼管理方面也更出色,改進了代碼重構、遷移和功能構建能力。此外,它在基于Windows的編碼環境中表現更好,并具有更先進的網絡安全功能,支持AI輔助的漏洞檢測、測試和緩解。
OpenAI表示,注重提升安全性對于AI驅動的軟件工程至關重要,因為現代企業基礎設施需要可靠的軟件。開發人員和安全團隊在發現和修復復雜軟件漏洞時需要各種幫助,同時還需要確保所使用的AI編碼工具不會制造更多問題。
Codex的軟件修復能力在本月早些時候得到了展示,安全研究員Andrew MacPherson使用GPT-5.1-Codex-Max檢查了React中的CVE-2025-55182漏洞。在博客文章中,他解釋了該模型如何使用迭代評估、模糊測試和漏洞分析的組合來緩解問題,同時還發現并緩解了之前未知的漏洞。
OpenAI表示,GPT-5.2-Codex引入的改進將對企業產生實際影響,使它們能夠自動化最復雜和重復的軟件工程任務,并在應用程序中集成更復雜的功能。通過同時支持網絡安全操作,它可以幫助組織提高效率、減少人為錯誤并在軟件工程中保持競爭優勢。
該公司表示,GPT-5.2-Codex從今天起向所有付費ChatGPT用戶開放。計劃在下周向應用程序編程接口用戶擴展訪問權限,并將啟動一個僅限邀請的可信訪問試點計劃,面向專注于防御性網絡安全的經審查的安全專業人員。
Q&A
Q1:GPT-5.2-Codex在基準測試中的表現如何?
A:GPT-5.2-Codex在SWE-Bench Pro基準測試中取得了56.4%的準確率,這是迄今所有編碼模型中的最高分數。在Terminal-Bench 2.0基準測試中也獲得了64%的分數,超越了早期版本的Codex。
Q2:GPT-5.2-Codex相比之前版本有哪些主要改進?
A:主要改進包括:更強的上下文壓縮能力,能夠進行長期多步驟編碼任務;改進的大規模代碼重構和遷移能力;在Windows編碼環境中的更好表現;增強的網絡安全功能,支持AI輔助的漏洞檢測、測試和緩解;以及更強大的視覺能力,可以更好地解讀截圖和技術圖表。
Q3:如何獲得GPT-5.2-Codex的使用權限?
A:GPT-5.2-Codex從發布當日起向所有付費ChatGPT用戶開放。OpenAI計劃在下周向應用程序編程接口用戶擴展訪問權限,并將啟動一個僅限邀請的可信訪問試點計劃,面向專注于防御性網絡安全的經審查安全專業人員。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.