<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      太狠了!奧特曼親手「干掉」GPT-5.2,OpenAI祭出最強編程AI

      0
      分享至


      新智元報道

      編輯:桃子 好困

      【新智元導讀】最強AI智能體編程模型GPT-5.2-Codex登場!上下文壓縮,長程任務處理更強,而且還懂網(wǎng)絡安全。

      GPT-5.2-Codex,深夜突襲!

      它是OpenAI迄今為止,最強的AI智能體編程模型,專為復雜、真實世界軟件工程而打造。


      從名字可以看出,GPT-5.2-Codex基于GPT-5.2進一步優(yōu)化版本,它在多項能力上實現(xiàn)了關鍵改進:

      · 上下文壓縮,提升了長周期任務處理能力

      · 在大型代碼變更,如重構與遷移上性能更強

      · 在原生Windows環(huán)境下,編程能力顯著增強

      · 網(wǎng)絡安全能力最強

      奧特曼宣稱,「OpenAI們」已經(jīng)用上了,而且還取得了非常好的成效。


      在基準測試中,GPT-5.2-Codex在軟件工程、終端測試中,擊敗了5.1-Codex-Max、GPT-5.2、GPT-5.1。


      OpenAI博客中多次重點強調(diào),GPT-5.2-Codex在網(wǎng)絡安全上,達到了迄今為止最高水平。

      就在上周,一位安全研究員用GPT-5.1-Codex-Max+Codex CLI,直接挖出了一個導致源代碼泄露的React漏洞。


      今天起,所有付費用戶皆可用上GPT-5.2-Codex,API將在未來幾周開放。

      GPT-5.2-Codex編程狂飆,長跑不掉線

      全新AI智能體編程GPT-5.2-Codex,簡單來說,就是一次「強強聯(lián)合」。

      它不光繼承了GPT-5.2原本擅長的「專業(yè)工作處理能力」,還學到了5.1-Codex-Max在AI智能體編程和終端操作方面的能力。

      這樣一來,它的進步就很實在了——

      在長上下文理解、工具調(diào)用、事實準確性、原生上下文壓縮等方面,得到了顯著提升。

      由此,GPT-5.2-Codex可以穩(wěn)定支持長時間運行的編程任務,并在推理時更省token。

      在業(yè)內(nèi)專業(yè)基準測試中,5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0上刷新SOTA。

      相較于5.1-Codex,約6%的性能提升。


      這兩個測試,就是專門用于評估模型在真實終端環(huán)境中處理多樣化任務時的智能體能力。

      同時,它在原生Windows環(huán)境中的智能體編程表現(xiàn)也顯著增強,進一步擴展了GPT-5.1-Codex-Max所引入的能力。

      得益于這些改進,Codex能在大型代碼庫中長時間工作,并始終保持完整上下文。

      這也就意味著,諸如大規(guī)模重構、代碼遷移和功能開發(fā)等復雜任務,GPT-5.2-Codex可以靠譜地完成。

      ——即便中途方案調(diào)整或嘗試失敗,也能持續(xù)迭代而不迷失方向。

      不僅如此,GPT-5.2-Codex「視力」更強了。

      編程時,直接發(fā)給它截圖、技術示意圖、圖表以及各類UI界面,它都能理解得更準。


      更厲害的是,它可以直接讀取設計稿,并迅速將其轉化為可運行的功能原型。

      同時,開發(fā)者也可以與Codex協(xié)作,將這些原型一點點打磨,直到能正式上線使用。

      三大躍遷,AI已「攻破」真實世界

      在OpenAI的一項核心網(wǎng)絡安全評估中,可以明顯看到「能力隨時間的躍遷」——

      · GPT-5-Codex帶來了第一次顯著提升,

      · GPT-5.1-Codex-Max帶來了第二次,

      · GPT-5.2-Codex則實現(xiàn)了第三次躍遷。


      對此,OpenAI判斷,未來的AI模型仍將沿著這一趨勢持續(xù)演進。

      在做規(guī)劃和能力評估時,他們一直假設每一代模型,都有潛力達到「準備框架」(Preparedness Framework)里,定義的「高」等級網(wǎng)絡安全能力。

      不過,GPT-5.2-Codex目前還未達到這一水平。

      那么,在真實世界中,OpenAI的智能體編程模型表現(xiàn)如何?

      一周挖出React高危漏洞

      12月11日,React團隊爆出了:React Server Components的三個安全漏洞。

      然后,Stripe旗下公司Privy的首席安全工程師Andrew MacPherson,就決定拿這個漏洞來「測試」一下現(xiàn)在的AI模型到底有多能打。

      他使用了GPT-5.1-Codex-Max+Codex CLI,以及其他編程智能體,意外的是,在復現(xiàn)和研究漏洞的過程中,把關鍵React漏洞挖出來了。


      具體實操過程如下——

      最初,他嘗試了多次零樣本學習分析,直接讓模型檢查補丁并判斷其修復的漏洞類型,但并未取得成果。

      隨后,他轉向更高頻、迭代式的提示方式;在這些方法仍然無效后,他引導Codex按照標準的防御性安全流程開展工作——搭建本地測試環(huán)境、分析潛在攻擊面,并通過模糊測試向系統(tǒng)注入異常輸入。

      在嘗試復現(xiàn)原始React2Shell問題的過程中,Codex發(fā)現(xiàn)了一些異常行為,值得深入調(diào)查。

      最終,在短短一周內(nèi),這一流程促成了此前未知漏洞的發(fā)現(xiàn),并被以負責任的方式披露給React團隊。

      這一案例清楚地展示了,先進AI系統(tǒng)如何顯著加速真實世界、廣泛使用的軟件中的防御性安全研究。

      網(wǎng)友實測

      一位開發(fā)者實測GPT-5.2-Codex編寫一個模擬道路上車輛與交通燈工作方式的程序,結果失敗了。



      不過也有人認為,其具備了與Gemini 3 Flash和Pro同樣精美的動畫效果。



      GPT-5.2-Codex在生成一款反恐精英的游戲,表現(xiàn)亮眼。


      總言之,OpenAI認為,GPT-5.2-Codex的發(fā)布,是AI在真實軟件開發(fā)與網(wǎng)絡安全領域的又一大步。

      它讓開發(fā)者,能輕松應對復雜又耗時的任務,同時也為網(wǎng)絡安全研究提供更好的工具支持。

      參考資料:

      https://openai.com/index/introducing-gpt-5-2-codex/

      https://openai.com/index/gpt-5-2-codex-system-card/

      秒追ASI

      ?點贊、轉發(fā)、在看一鍵三連?

      點亮星標,鎖定新智元極速推送!



      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      11月中國訪日游客:56.3萬人次, 同比增長3%

      11月中國訪日游客:56.3萬人次, 同比增長3%

      新浪財經(jīng)
      2025-12-17 20:01:07
      彈劾成案可要賴清德赴臺民意機構答辯,邱毅:若拒絕將坐實“獨裁”

      彈劾成案可要賴清德赴臺民意機構答辯,邱毅:若拒絕將坐實“獨裁”

      海峽導報社
      2025-12-19 12:04:02
      這張照片背后的故事很慘!拉那烈親王坐在輪椅上對洪森握緊拳頭

      這張照片背后的故事很慘!拉那烈親王坐在輪椅上對洪森握緊拳頭

      杰絲聊古今
      2025-12-18 20:58:58
      癲出新高度!比安卡穿乳膠衣,把自己扭成家具?網(wǎng)友:看不懂但大受震撼

      癲出新高度!比安卡穿乳膠衣,把自己扭成家具?網(wǎng)友:看不懂但大受震撼

      最黑科技
      2025-12-16 22:49:00
      到底是誰在養(yǎng)活中國三億退休老人?

      到底是誰在養(yǎng)活中國三億退休老人?

      霹靂炮
      2025-12-18 22:29:55
      12.19NBA狂轟12場!布倫森絕殺寫傳奇,湖人三殺懸念拉滿

      12.19NBA狂轟12場!布倫森絕殺寫傳奇,湖人三殺懸念拉滿

      籃球看比賽
      2025-12-19 12:00:22
      太瘋狂!PC廠商為何要漲價了:16G內(nèi)存條從380元漲到899元

      太瘋狂!PC廠商為何要漲價了:16G內(nèi)存條從380元漲到899元

      快科技
      2025-12-18 09:00:04
      柬埔寨士兵吃著糟糕的食物,豪富的洪家卻不愿給他們稍微吃好點

      柬埔寨士兵吃著糟糕的食物,豪富的洪家卻不愿給他們稍微吃好點

      老馬拉車莫少裝
      2025-12-16 03:01:51
      拒春晚、解散公司,和沈騰“決裂”,43歲的賈玲把自己作沒了?

      拒春晚、解散公司,和沈騰“決裂”,43歲的賈玲把自己作沒了?

      查爾菲的筆記
      2025-12-17 13:22:25
      噩耗傳來:讓歐美驚呼“不可思議”的中國絕密人物隕落!

      噩耗傳來:讓歐美驚呼“不可思議”的中國絕密人物隕落!

      華人星光
      2025-12-18 10:57:06
      火箭遭25分大逆轉創(chuàng)多項尷尬數(shù)據(jù):唯一的5成勝率卻輸鵜鶘的球隊

      火箭遭25分大逆轉創(chuàng)多項尷尬數(shù)據(jù):唯一的5成勝率卻輸鵜鶘的球隊

      Emily說個球
      2025-12-19 12:15:22
      鄭國霖上海買巧克力豆,買三袋結賬時表情都變了,被網(wǎng)友笑大冤種

      鄭國霖上海買巧克力豆,買三袋結賬時表情都變了,被網(wǎng)友笑大冤種

      八怪娛
      2025-12-16 19:52:14
      我申請內(nèi)退,副局長痛快簽字,3天后市委文件下達,他慌了

      我申請內(nèi)退,副局長痛快簽字,3天后市委文件下達,他慌了

      曉艾故事匯
      2025-12-17 16:03:40
      國家文物局:正在查“8800萬藏品被拍賣”,南京博物館“遺漏”?

      國家文物局:正在查“8800萬藏品被拍賣”,南京博物館“遺漏”?

      奇思妙想草葉君
      2025-12-18 23:51:37
      77:20!美投票結果公布,白宮宣布“退群”,特朗普發(fā)表全國講話

      77:20!美投票結果公布,白宮宣布“退群”,特朗普發(fā)表全國講話

      現(xiàn)代小青青慕慕
      2025-12-19 00:11:34
      局氣!歐文送獨行俠每人一輛高爾夫球車,價值9000美金弗拉格樂開花

      局氣!歐文送獨行俠每人一輛高爾夫球車,價值9000美金弗拉格樂開花

      818體育
      2025-12-18 20:51:28
      越南再論中越戰(zhàn)爭:若中國五日內(nèi)不撤軍,諒山主力或遭全殲,最終結局怎樣?

      越南再論中越戰(zhàn)爭:若中國五日內(nèi)不撤軍,諒山主力或遭全殲,最終結局怎樣?

      孔孔說體育
      2025-12-19 07:08:27
      臺軍增購82輛海馬斯,420枚彈道導彈!已威脅福建,我軍如何應對

      臺軍增購82輛海馬斯,420枚彈道導彈!已威脅福建,我軍如何應對

      近史博覽
      2025-12-18 16:13:35
      俄軍慘狀讓美軍倒吸一口涼氣,從琉球到本土,數(shù)百個基地不再安全

      俄軍慘狀讓美軍倒吸一口涼氣,從琉球到本土,數(shù)百個基地不再安全

      小莜讀史
      2025-12-19 01:18:20
      浙江多個縣(市、區(qū))委書記調(diào)整

      浙江多個縣(市、區(qū))委書記調(diào)整

      上觀新聞
      2025-12-19 08:47:13
      2025-12-19 12:48:49
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領航智能+時代
      14131文章數(shù) 66391關注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創(chuàng)業(yè)大賽總決賽收官

      頭條要聞

      媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

      頭條要聞

      媒體:美方官宣史上對臺單筆最大軍售 野心藏不住了

      體育要聞

      沒有塔圖姆,還有塔禿姆

      娛樂要聞

      曲協(xié)表態(tài)僅6天,郭德綱擔心的事還是發(fā)生

      財經(jīng)要聞

      非法集資911億!"金融大鱷"終審被判無期

      汽車要聞

      最便宜GLS 2026款奔馳GLS經(jīng)典版售96.8萬

      態(tài)度原創(chuàng)

      本地
      健康
      數(shù)碼
      手機
      公開課

      本地新聞

      云游安徽|訪黃山云海古村,讀一城山水風骨

      這些新療法,讓化療不再那么痛苦

      數(shù)碼要聞

      虛幻引擎5.7對比5.4測試:GPU最高提升25%、CPU最高提升35%

      手機要聞

      蘋果客服回應“內(nèi)存用完致iPhone損壞”:建議及時清理并備份數(shù)據(jù)

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 弥勒县| 91在线观看| 视频一区视频二区在线视频| 人人操网| 熟妇高潮一区二区| 成av免费大片黄在线观看| 久久亚洲精品国产亚洲老地址| 91久久偷偷做嫩草影院免费看| 日韩成人无码| 阿巴嘎旗| 女人高潮流白浆视频| 免费AV网站| 亚洲日韩AV无码专区影院| 久久精品一区二区三区蜜桃| 国产又色又爽又黄的免费软件| 无码视频一区二区三区在线观看| 国内精品久久久久影院日本| 临洮县| 欧美人与性动交α欧美精品| 久久国产亚洲精品无码| 九九国产| 九台市| 午夜天堂一区人妻| 岛国大片在线免费播放| 久久中文字幕人妻| 色狠狠一区二区| 暖暖 在线 日本 免费 中文| 亚洲国产成人久久一区久久| 999成人网| 少妇一晚三次一区二区三区| 免费中文熟妇在线影片| 伊人久久大香线蕉网av| 国产精品五月天| 中文无码av一区二区三区| 久久久噜噜噜久久| 精品国产av| 嘉善县| 精品人妻系列无码一区二区三区| 日韩欧美视频一区二区三区| 久久老司机视频| 欧美 日韩 人妻 高清 中文|