網易首頁 > 網易號 > 正文申請入駐

OpenAI發布GPT-5.2-Codex模型，軟件工程自動化能力大幅提升

2025-12-19 16:46:03　來源: 至頂頭條

北京舉報

分享至

OpenAI集團公司今日發布了GPT-Codex的最新版本，這是一個智能體人工智能編碼模型，專門用于自動化復雜的軟件工程任務。

最新版本GPT-5.2-Codex在GPT-5.2的基礎上構建，增加了上下文壓縮、大規模代碼重構、Windows環境性能和網絡安全方面的改進。

根據OpenAI的博客文章，GPT-5.2-Codex在SWE-Bench Pro基準測試中取得了無與倫比的成績，準確率達到56.4%，超越了迄今為止發布的所有其他編碼模型。它在Terminal-Bench 2.0基準測試中也獲得了64%的分數，優于早期版本的Codex。該模型還得益于更強大的視覺能力，能夠更好地解讀屏幕截圖、技術圖表和用戶界面，從而將軟件設計原型轉化為功能原型。

OpenAI表示，GPT-5.2-Codex旨在推進軟件工程，軟件工程是通過將工程原理與編程知識相結合來設計、開發、測試和維護應用程序的過程。目標是創建高質量、可靠且可維護的軟件，能夠不斷演進以滿足用戶需求。

新模型處理耗時任務的能力使其特別擅長"重構"，這是軟件工程的關鍵要素，涉及調整應用程序的代碼庫，不是為了添加新功能，而是為了提升其質量。例如，它可以調整應用程序的代碼庫以減少內存使用或提高響應速度。

GPT-5.2-Codex代表了OpenAI在生成式AI編碼能力方面多次迭代改進的成果。早期的模型如GPT-5-Codex和GPT-5.1-Codex-Max逐步改進了多步推理、長上下文理解和編碼環境中的工具集成等方面，而GPT-5.2-Codex在多個方面進一步發展。

OpenAI表示，由于其上下文壓縮能力，該模型在長期任務執行方面表現更佳，能夠進行持續的多步編碼任務而不會丟失上下文。在大規模代碼管理方面也更出色,改進了代碼重構、遷移和功能構建能力。此外，它在基于Windows的編碼環境中表現更好，并具有更先進的網絡安全功能，支持AI輔助的漏洞檢測、測試和緩解。

OpenAI表示，注重提升安全性對于AI驅動的軟件工程至關重要，因為現代企業基礎設施需要可靠的軟件。開發人員和安全團隊在發現和修復復雜軟件漏洞時需要各種幫助，同時還需要確保所使用的AI編碼工具不會制造更多問題。

Codex的軟件修復能力在本月早些時候得到了展示，安全研究員Andrew MacPherson使用GPT-5.1-Codex-Max檢查了React中的CVE-2025-55182漏洞。在博客文章中，他解釋了該模型如何使用迭代評估、模糊測試和漏洞分析的組合來緩解問題，同時還發現并緩解了之前未知的漏洞。

OpenAI表示，GPT-5.2-Codex引入的改進將對企業產生實際影響，使它們能夠自動化最復雜和重復的軟件工程任務，并在應用程序中集成更復雜的功能。通過同時支持網絡安全操作，它可以幫助組織提高效率、減少人為錯誤并在軟件工程中保持競爭優勢。

該公司表示，GPT-5.2-Codex從今天起向所有付費ChatGPT用戶開放。計劃在下周向應用程序編程接口用戶擴展訪問權限，并將啟動一個僅限邀請的可信訪問試點計劃，面向專注于防御性網絡安全的經審查的安全專業人員。

Q&A

Q1：GPT-5.2-Codex在基準測試中的表現如何？

A：GPT-5.2-Codex在SWE-Bench Pro基準測試中取得了56.4%的準確率，這是迄今所有編碼模型中的最高分數。在Terminal-Bench 2.0基準測試中也獲得了64%的分數，超越了早期版本的Codex。

Q2：GPT-5.2-Codex相比之前版本有哪些主要改進？

A：主要改進包括：更強的上下文壓縮能力，能夠進行長期多步驟編碼任務；改進的大規模代碼重構和遷移能力；在Windows編碼環境中的更好表現；增強的網絡安全功能，支持AI輔助的漏洞檢測、測試和緩解；以及更強大的視覺能力，可以更好地解讀截圖和技術圖表。

Q3：如何獲得GPT-5.2-Codex的使用權限？

A：GPT-5.2-Codex從發布當日起向所有付費ChatGPT用戶開放。OpenAI計劃在下周向應用程序編程接口用戶擴展訪問權限，并將啟動一個僅限邀請的可信訪問試點計劃，面向專注于防御性網絡安全的經審查安全專業人員。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.