網易首頁 > 網易號 > 正文申請入駐

OpenAI推出Codex應用的GPT5，搶奪應用市場機會

2025-09-16 08:56:24　來源: 刀馬物語

山西舉報

分享至

OpenAI于周一宣布，將為其 AI 編程工具 Codex 推出新版 GPT-5。該公司表示，這款名為 “GPT-5-Codex” 的新模型，其“思考” 時間的分配比前代模型更具動態性，完成一項編程任務的耗時可從幾秒到 7 小時不等。

目前，GPT-5-Codex已開始在 Codex 系列產品中逐步推出。用戶可通過終端、集成開發環境（IDE）、GitHub 或ChatGPT 訪問該工具，且所有 ChatGPT Plus、Pro、Business、Edu 及企業版（Enterprise）用戶均可使用。OpenAI 稱，未來計劃向 API 客戶開放該模型的使用權限。

OpenAI希望在與 Claude Code、Anysphere 旗下的 Cursor、微軟 GitHub Copilot 等其他 AI 編程產品展開競爭。當前市場中，AI 編程工具市場的競爭已愈發激烈。2025 年初，Cursor 的年度經常性收入（ARR）突破 5 億美元；而另一款類似代碼編輯器 Windsurf 則成為多方競購的焦點，OpenAI 表示，GPT-5-Codex 的表現均優于普通 GPT-5：一是衡量智能體編程能力的基準測試 SWE-bench Verified，二是針對大型成熟代碼庫中代碼重構任務的性能測試。

可以說，在AI工具應用方面，各大巨頭都是不遺余力地進行創新和不斷地技術迭代。有人說，GPT-5-Codex最顛覆性的突破，是讓AI首次擁有了自主分配"思考時間"的能力。在SWE-bench Verified基準測試中，這個特性使其以74.5%的準確率超越GPT-5的72.8%，更在代碼重構任務中實現碾壓——51.3%對33.9%的得分差距，相當于資深工程師與初級開發者的能力鴻溝。這種差距的根源，在于傳統AI模型像剛入行的新人，無論任務難易都匆匆交卷，而新版Codex學會了像專家一樣判斷：簡單的API調用幾秒完成，復雜的算法優化則投入數小時迭代。

OpenAI的動態時間分配機制顯然也是從實際應用出發，不同于傳統路由機制在任務初期就固定資源分配，GPT-5-Codex能在處理過程中實時調整策略。正如產品負責人恩比里科斯所言："它可能在5分鐘后決定需要再投入1小時，這種靈活性讓AI首次具備了處理開放性編程問題的能力。"在實際測試中，模型會對復雜任務進行多輪測試-反饋循環，甚至會主動重構代碼結構，這種"自我糾錯"能力使其錯誤評論率從GPT-5的13.7%驟降至4.4%。

這種變革直擊編程痛點。在追求"秒級響應"的AI時代，GPT-5-Codex的7小時模式顯得格格不入，卻意外解決了編程效率的核心矛盾。傳統AI工具雖快但質量堪憂，某調查顯示開發者平均要花40%時間修正AI生成的錯誤代碼。而新版Codex通過延長思考時間，將"高影響力建議"占比從39.4%提升至52.4%，每個PR的平均評論數從1.32條降至0.93條，大幅減少了來回修改的內耗。

可以說，AI不僅完成了代碼生成，還自主編寫了符合ISO 26262安全標準的測試用例。過去需要安全專家審核兩周，現在Codex花5小時生成的測試套件直接通過認證。這種效率提升來自模型對任務本質的深刻理解——它知道哪些地方需要慢下來，哪些可以快速處理。

開發工具鏈的深度整合放大了這種優勢。GPT-5-Codex與VS Code的無縫銜接，使其能在IDE中完成從代碼生成、測試到PR提交的全流程。有開發者分享，通過分階段指令（先建端點、再加認證、最后寫測試），12小時內完成了原本需要三周的用戶系統開發。這種效率并非來自速度，而是AI具備了類似人類的項目管理能力。可以說，GPT-5-Codex的推出，將AI編程工具的競爭推向了新維度。當Claude-3.5在PaperBench綜合測試中領先時，OpenAI選擇在編程垂直領域構筑壁壘。

相比通用大模型，GPT-5-Codex的分詞器針對代碼場景優化，增加空格專用token使代碼表示效率提升30%；推理機制采用核采樣技術，遇到關鍵語法自動終止，避免無效代碼膨脹。這種針對性設計使其在處理Python、Go甚至冷門的OCaml語言時都游刃有余，重構任務的跨語言兼容性評分比競品高27%。當然，也有批評者指出，7小時的響應時間不適合敏捷開發，而按計算時長計費的模式可能增加成本。更深刻的挑戰在于人機協作模式的重構——當AI能獨立完成復雜任務時，開發者的角色將從編碼者轉型為需求定義者和結果審核者。

從秒級響應到小時級思考，GPT-5-Codex的時間革命揭示了AI發展的新規律：真正的智能不在于速度，而在于判斷何時該快、何時該慢。當AI開始像人類專家一樣分配時間，當12小時的深度工作能替代三周的重復勞動，編程行業的效率標準和人才需求都將被重新定義。或許，未來的程序員考核，可能不再是敲代碼的速度，而是給AI提需求的精準度。在這場靜默的革命中，時間不僅是度量效率的單位，更成為AI理解復雜世界的新維度。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.