![]()
OpenAI于周一宣布,將為其 AI 編程工具 Codex 推出新版 GPT-5。該公司表示,這款名為 “GPT-5-Codex” 的新模型,其“思考” 時間的分配比前代模型更具動態性,完成一項編程任務的耗時可從幾秒到 7 小時不等。
目前,GPT-5-Codex已開始在 Codex 系列產品中逐步推出。用戶可通過終端、集成開發環境(IDE)、GitHub 或ChatGPT 訪問該工具,且所有 ChatGPT Plus、Pro、Business、Edu 及企業版(Enterprise)用戶均可使用。OpenAI 稱,未來計劃向 API 客戶開放該模型的使用權限。
OpenAI希望在與 Claude Code、Anysphere 旗下的 Cursor、微軟 GitHub Copilot 等其他 AI 編程產品展開競爭。當前市場中,AI 編程工具市場的競爭已愈發激烈。2025 年初,Cursor 的年度經常性收入(ARR)突破 5 億美元;而另一款類似代碼編輯器 Windsurf 則成為多方競購的焦點,OpenAI 表示,GPT-5-Codex 的表現均優于普通 GPT-5:一是衡量智能體編程能力的基準測試 SWE-bench Verified,二是針對大型成熟代碼庫中代碼重構任務的性能測試。
可以說,在AI工具應用方面,各大巨頭都是不遺余力地進行創新和不斷地技術迭代。有人說,GPT-5-Codex最顛覆性的突破,是讓AI首次擁有了自主分配"思考時間"的能力。在SWE-bench Verified基準測試中,這個特性使其以74.5%的準確率超越GPT-5的72.8%,更在代碼重構任務中實現碾壓——51.3%對33.9%的得分差距,相當于資深工程師與初級開發者的能力鴻溝。這種差距的根源,在于傳統AI模型像剛入行的新人,無論任務難易都匆匆交卷,而新版Codex學會了像專家一樣判斷:簡單的API調用幾秒完成,復雜的算法優化則投入數小時迭代。
OpenAI的動態時間分配機制顯然也是從實際應用出發,不同于傳統路由機制在任務初期就固定資源分配,GPT-5-Codex能在處理過程中實時調整策略。正如產品負責人恩比里科斯所言:"它可能在5分鐘后決定需要再投入1小時,這種靈活性讓AI首次具備了處理開放性編程問題的能力。"在實際測試中,模型會對復雜任務進行多輪測試-反饋循環,甚至會主動重構代碼結構,這種"自我糾錯"能力使其錯誤評論率從GPT-5的13.7%驟降至4.4%。
這種變革直擊編程痛點。在追求"秒級響應"的AI時代,GPT-5-Codex的7小時模式顯得格格不入,卻意外解決了編程效率的核心矛盾。傳統AI工具雖快但質量堪憂,某調查顯示開發者平均要花40%時間修正AI生成的錯誤代碼。而新版Codex通過延長思考時間,將"高影響力建議"占比從39.4%提升至52.4%,每個PR的平均評論數從1.32條降至0.93條,大幅減少了來回修改的內耗。
可以說,AI不僅完成了代碼生成,還自主編寫了符合ISO 26262安全標準的測試用例。過去需要安全專家審核兩周,現在Codex花5小時生成的測試套件直接通過認證。這種效率提升來自模型對任務本質的深刻理解——它知道哪些地方需要慢下來,哪些可以快速處理。
開發工具鏈的深度整合放大了這種優勢。GPT-5-Codex與VS Code的無縫銜接,使其能在IDE中完成從代碼生成、測試到PR提交的全流程。有開發者分享,通過分階段指令(先建端點、再加認證、最后寫測試),12小時內完成了原本需要三周的用戶系統開發。這種效率并非來自速度,而是AI具備了類似人類的項目管理能力。可以說,GPT-5-Codex的推出,將AI編程工具的競爭推向了新維度。當Claude-3.5在PaperBench綜合測試中領先時,OpenAI選擇在編程垂直領域構筑壁壘。
相比通用大模型,GPT-5-Codex的分詞器針對代碼場景優化,增加空格專用token使代碼表示效率提升30%;推理機制采用核采樣技術,遇到關鍵語法自動終止,避免無效代碼膨脹。這種針對性設計使其在處理Python、Go甚至冷門的OCaml語言時都游刃有余,重構任務的跨語言兼容性評分比競品高27%。當然,也有批評者指出,7小時的響應時間不適合敏捷開發,而按計算時長計費的模式可能增加成本。更深刻的挑戰在于人機協作模式的重構——當AI能獨立完成復雜任務時,開發者的角色將從編碼者轉型為需求定義者和結果審核者。
從秒級響應到小時級思考,GPT-5-Codex的時間革命揭示了AI發展的新規律:真正的智能不在于速度,而在于判斷何時該快、何時該慢。當AI開始像人類專家一樣分配時間,當12小時的深度工作能替代三周的重復勞動,編程行業的效率標準和人才需求都將被重新定義。或許,未來的程序員考核,可能不再是敲代碼的速度,而是給AI提需求的精準度。在這場靜默的革命中,時間不僅是度量效率的單位,更成為AI理解復雜世界的新維度。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.