<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      GPT-5.3上線Codex!OpenAI回應(yīng)Claude新模型只用了15分鐘

      0
      分享至

      Jay 發(fā)自 凹非寺
      量子位 | 公眾號(hào) QbitAI

      火星撞地球,新模型大戰(zhàn)!

      Claude Opus 4.6發(fā)布僅僅15分鐘,OpenAI也甩出了自己最新最強(qiáng)編程模型——

      GPT-5.3-Codex。



      最直觀的感受是,這個(gè)新模型終于有點(diǎn)美學(xué)品味了。

      官方展示了兩個(gè)Demo:一個(gè)賽車游戲、一個(gè)潛水游戲。還蠻有風(fēng)格的。



      據(jù)說,GPT-5.3-Codex在幾乎沒有人工干預(yù)的情況下,持續(xù)迭代這些游戲,累計(jì)消耗了數(shù)百萬token

      在網(wǎng)頁開發(fā)上,除了UI更好看,對(duì)「意圖」的理解也更強(qiáng)了。

      即便Prompt給得不清楚,它也能自動(dòng)補(bǔ)全邏輯,生成一個(gè)功能齊全的網(wǎng)站。



      就這些Demo來看,設(shè)計(jì)感確實(shí)比之前強(qiáng)了一截。

      Computer use能力同樣拉滿,現(xiàn)在已經(jīng)能用來幫金融從業(yè)者直接做PPT。



      其他職場工作也能覆蓋,尤其是在專業(yè)知識(shí)密集型任務(wù)上,寫文檔、做電子表格都沒什么問題。



      硬實(shí)力方面,官方給出的亮點(diǎn)如下:

      • 更聰明:SWE-Bench Pro 57%,TerminalBench 2.0 76%,OSWorld 64%。
      • 更可控:支持任務(wù)進(jìn)行中的實(shí)時(shí)引導(dǎo),可隨時(shí)調(diào)整方向并獲取更新。
      • 更快速:完成相同任務(wù)時(shí),所需token不到5.2-Codex的一半,單token速度提升超過25%。
      • 更Agent:不只是更會(huì)寫代碼,計(jì)算機(jī)操作同樣很強(qiáng)。

      直接看這張對(duì)比表會(huì)更直觀,幾乎每一個(gè)維度,都比上一代有明顯提升。



      網(wǎng)友直呼過于刺激,昨天OpenAI剛被Anthropic拿廣告狙了一槍,今天就對(duì)轟了回來。

      一天之內(nèi),兩個(gè)重量級(jí)編程模型



      評(píng)論區(qū)也迅速分成了Anthropic派和OpenAI派。





      下面來看看,這場奧特曼主動(dòng)挑起的AI coding大戰(zhàn),OpenAI到底表現(xiàn)如何?

      GPT 5.3 Codex

      大家最關(guān)心的,當(dāng)然還是編程能力。

      OpenAI表示,GPT-5.3-Codex在SWE-Bench Pro上實(shí)現(xiàn)了SOTA。

      這是一個(gè)專為真實(shí)世界軟件工程設(shè)計(jì)的測試,覆蓋四種編程語言,整體難度更高、任務(wù)更豐富,也更貼近真實(shí)生產(chǎn)場景。



      同時(shí),GPT-5.3-Codex在Terminal-Bench 2.0上的表現(xiàn)也有明顯提升。



      更關(guān)鍵的是效率。在拿下這些成績的同時(shí),GPT-5.3-Codex使用的token數(shù)量少于任何以往模型

      除了編程能力,新一代Codex的另一個(gè)重點(diǎn)是Computer use

      OSWorld是一項(xiàng)面向智能體的計(jì)算機(jī)使用基準(zhǔn)測試,要求模型在可視化的桌面計(jì)算機(jī)環(huán)境中完成各類生產(chǎn)力任務(wù)。

      結(jié)果顯示,GPT-5.3-Codex在計(jì)算機(jī)使用能力上,明顯強(qiáng)于此前的GPT模型。



      綜上,GPT-5.3-Codex不是一次單點(diǎn)模型能力突破,更像是基于智能體的全方位發(fā)展,編碼、前端開發(fā)、計(jì)算機(jī)操作全都有提升

      更有意思的是,這次GPT-5.3-Codex直接參與了自己的訓(xùn)練過程

      OpenAI表示,這是他們首個(gè)參與「自我加速」的模型。Codex團(tuán)隊(duì)在研發(fā)過程中使用其早期版本,來調(diào)試自身訓(xùn)練流程、管理部署,并評(píng)估測試結(jié)果。

      官方也給出了一些具體例子。

      訓(xùn)練階段,研究團(tuán)隊(duì)使用Codex監(jiān)控和調(diào)試訓(xùn)練任務(wù),幫助在整個(gè)訓(xùn)練過程中追蹤模型行為變化,對(duì)交互進(jìn)行深入分析,并提出改進(jìn)方案。

      數(shù)據(jù)分析方面,一位數(shù)據(jù)科學(xué)家與GPT-5.3-Codex協(xié)作,構(gòu)建了新的數(shù)據(jù)管道,并以遠(yuǎn)超傳統(tǒng)儀表盤工具的方式對(duì)結(jié)果進(jìn)行了可視化。

      隨后,研究人員與Codex一起分析這些結(jié)果,模型在不到三分鐘內(nèi),就從數(shù)千個(gè)數(shù)據(jù)點(diǎn)中提煉出了關(guān)鍵洞見。

      工程團(tuán)隊(duì)則借助Codex優(yōu)化和適配GPT-5.3-Codex的測試與運(yùn)行框架。

      當(dāng)開始出現(xiàn)影響用戶體驗(yàn)的異常邊緣案例時(shí),團(tuán)隊(duì)成員通過Codex定位到了上下文渲染相關(guān)的缺陷,并進(jìn)一步追溯到了緩存命中率偏低的原因。

      Two More Things

      與Anthropic的巔峰對(duì)決的確相當(dāng)精彩,但OpenAI其實(shí)還有兩個(gè)值得關(guān)注的大動(dòng)作。

      1、Frontier:一個(gè)幫助企業(yè)打造「AI同事」的平臺(tái)



      這是OpenAI一項(xiàng)相當(dāng)重磅的ToB業(yè)務(wù),目標(biāo)很明確:讓Agent真正進(jìn)入公司工作流。

      具體實(shí)現(xiàn)方式,包括共享上下文、上手式的入職引導(dǎo)、帶反饋的實(shí)踐學(xué)習(xí),以及清晰的權(quán)限與邊界。

      據(jù)悉,HP、Intuit、Oracle、State Farm、Thermo Fisher和Uber等知名企業(yè),已經(jīng)早早采用了Frontier。

      2、AI4S:OpenAI和Ginkgo聯(lián)手,用GPT-5把蛋白質(zhì)合成成本打下來了40%



      這是一家做合成生物學(xué)的實(shí)驗(yàn)室型公司,他們將GPT-5接入一座自主實(shí)驗(yàn)室,讓模型可以提出實(shí)驗(yàn)方案、規(guī)模化執(zhí)行實(shí)驗(yàn)、從結(jié)果中學(xué)習(xí),并決定下一步該嘗試什么,完整跑通了一個(gè)閉環(huán)。

      2026年,或許是AI4S加速演進(jìn)的一年。

      不過,在OpenAI忙著和Anthropic對(duì)狙,網(wǎng)友們被一系列新動(dòng)態(tài)弄的眼花繚亂的同時(shí),評(píng)論區(qū)也有另一種聲音。

      • 把4o還給我!!



      直到現(xiàn)在,奧特曼依然沒有回應(yīng)4o被徹底下架這件事。

      或許,真的是和Anthropic打得太忙了。




      [1]https://openai.com/index/introducing-gpt-5-3-codex/
      [2]https://openai.com/index/introducing-openai-frontier/
      [3] https://x.com/i/trending/2019496485793198148

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      山東一家大型建筑公司扛不住了!

      山東一家大型建筑公司扛不住了!

      黯泉
      2026-02-21 22:18:12
      李嘉誠初五慈山寺迎財(cái)神,98歲步行狀態(tài)佳,李澤鉅隨行!

      李嘉誠初五慈山寺迎財(cái)神,98歲步行狀態(tài)佳,李澤鉅隨行!

      空樽對(duì)月花獨(dú)瘦
      2026-02-22 00:13:10
      奧薩蘇納vs皇馬:布季米爾、哈維-加蘭首發(fā),姆巴佩、維尼修斯出戰(zhàn)

      奧薩蘇納vs皇馬:布季米爾、哈維-加蘭首發(fā),姆巴佩、維尼修斯出戰(zhàn)

      懂球帝
      2026-02-22 00:21:03
      馬內(nèi)身價(jià)25萬歐轉(zhuǎn)會(huì)費(fèi)5000萬鎊!憑什么?利物浦曼聯(lián)阿森納都有意

      馬內(nèi)身價(jià)25萬歐轉(zhuǎn)會(huì)費(fèi)5000萬鎊!憑什么?利物浦曼聯(lián)阿森納都有意

      體育世界
      2026-02-22 01:14:19
      不愧是今年春晚最美的節(jié)目,女神們真的美爆啦!

      不愧是今年春晚最美的節(jié)目,女神們真的美爆啦!

      陳列共和
      2026-02-18 19:43:08
      首例!“自動(dòng)駕駛”致死案,車企面臨天價(jià)賠償!

      首例!“自動(dòng)駕駛”致死案,車企面臨天價(jià)賠償!

      電動(dòng)知家
      2026-02-21 18:54:09
      內(nèi)訌!阿森納頂薪引眾怒,名宿力勸1 億先生逼宮離隊(duì)

      內(nèi)訌!阿森納頂薪引眾怒,名宿力勸1 億先生逼宮離隊(duì)

      瀾歸序
      2026-02-22 02:28:54
      33.9萬!火鍋店稱把春節(jié)4天盈利分給員工,老板:去年關(guān)了兩家店 但春節(jié)福利要堅(jiān)持

      33.9萬!火鍋店稱把春節(jié)4天盈利分給員工,老板:去年關(guān)了兩家店 但春節(jié)福利要堅(jiān)持

      紅星新聞
      2026-02-21 10:12:08
      樂福一家近照,37歲沒退役,場均7分拿底薪,超模妻子為他生2娃

      樂福一家近照,37歲沒退役,場均7分拿底薪,超模妻子為他生2娃

      大西體育
      2026-02-21 16:36:42
      張藝謀新片帶火深圳!有觀眾留“后遺癥”:看見垃圾桶就想掏

      張藝謀新片帶火深圳!有觀眾留“后遺癥”:看見垃圾桶就想掏

      南方都市報(bào)
      2026-02-21 11:52:41
      日本一貨船與漁船發(fā)生相撞 多人死傷

      日本一貨船與漁船發(fā)生相撞 多人死傷

      環(huán)球網(wǎng)資訊
      2026-02-20 19:51:24
      教過很多孩子,回頭看才敢告訴你:小學(xué)差的,到初中大概率還是差

      教過很多孩子,回頭看才敢告訴你:小學(xué)差的,到初中大概率還是差

      好爸育兒
      2026-02-11 20:45:27
      解放軍報(bào):全軍官兵時(shí)刻準(zhǔn)備著

      解放軍報(bào):全軍官兵時(shí)刻準(zhǔn)備著

      中國網(wǎng)
      2026-02-19 13:47:44
      周秀娜配合李家誠演戲!?

      周秀娜配合李家誠演戲!?

      八卦瘋叔
      2026-02-21 10:43:49
      90歲美國心理專家臨終告誡:真正折磨你的,是你自己

      90歲美國心理專家臨終告誡:真正折磨你的,是你自己

      青蘋果sht
      2026-02-12 07:01:01
      劍南春|國米2-0客勝萊切,姆希塔良、阿坎吉替補(bǔ)建功

      劍南春|國米2-0客勝萊切,姆希塔良、阿坎吉替補(bǔ)建功

      懂球帝
      2026-02-22 03:09:32
      一個(gè)令人驚訝的現(xiàn)象:今年過年同學(xué)聚會(huì)消失了

      一個(gè)令人驚訝的現(xiàn)象:今年過年同學(xué)聚會(huì)消失了

      新國學(xué)文化
      2026-02-19 18:58:25
      對(duì)心臟最好的1種肉,建議中老年人要常吃,血管干凈,心跳穩(wěn)

      對(duì)心臟最好的1種肉,建議中老年人要常吃,血管干凈,心跳穩(wěn)

      江江食研社
      2026-02-12 20:30:06
      冰壺女隊(duì)表現(xiàn)不佳,固執(zhí)戰(zhàn)術(shù)成敗因,輸給美國后難以翻身

      冰壺女隊(duì)表現(xiàn)不佳,固執(zhí)戰(zhàn)術(shù)成敗因,輸給美國后難以翻身

      生活新鮮市
      2026-02-22 02:04:37
      那藝娜被認(rèn)定劣跡藝人!靠說蹩腳中文,假扮俄羅斯美女走紅

      那藝娜被認(rèn)定劣跡藝人!靠說蹩腳中文,假扮俄羅斯美女走紅

      韓小娛
      2026-02-21 10:30:22
      2026-02-22 03:32:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      12186文章數(shù) 176389關(guān)注度
      往期回顧 全部

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      頭條要聞

      貝加爾湖7名遇難者身份全部確認(rèn) 1家4口僅1人生還

      頭條要聞

      貝加爾湖7名遇難者身份全部確認(rèn) 1家4口僅1人生還

      體育要聞

      徐夢(mèng)桃:這是我第一塊銅牌 給我換個(gè)吉祥物

      娛樂要聞

      黃曉明澳門賭博輸十幾億 本人親自回應(yīng)

      財(cái)經(jīng)要聞

      一覺醒來,世界大變,特朗普改新打法了

      汽車要聞

      比亞迪的“顏值擔(dān)當(dāng)”來了 方程豹首款轎車路跑信息曝光

      態(tài)度原創(chuàng)

      親子
      藝術(shù)
      手機(jī)
      健康
      公開課

      親子要聞

      中韓寶寶得要從小灌輸中國文化 真正的年味是什么?

      藝術(shù)要聞

      他的肖像畫和人體畫,竟讓人贊嘆不已!

      手機(jī)要聞

      三星Galaxy S26系列顏色曝光:將推6種配色,兩款為線上專屬

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版