<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      剛剛,GPT-5.2滿分屠榜,OpenAI十周年王者歸來(lái)

      0
      分享至


      機(jī)器之心報(bào)道

      機(jī)器之心編輯部

      谷歌的領(lǐng)先優(yōu)勢(shì),只保持了不到一個(gè)月。

      今天是 OpenAI 的十周年紀(jì)念日,十周年之際,來(lái)點(diǎn)大的。

      在「紅色警報(bào)」后,OpenAI 在北京時(shí)間本周五拿出了最新的頂級(jí)模型 GPT-5.2 系列 —— 迄今為止在專業(yè)知識(shí)工作上最強(qiáng)大的模型系列。



      簡(jiǎn)而言之,OpenAI 本次推出:

      GPT-5.2 Instant,為日常工作與學(xué)習(xí)而打造:

      • 與 GPT-5.1 一樣溫暖、對(duì)話自然
      • 更清晰的講解,把關(guān)鍵信息提前呈現(xiàn)
      • 改進(jìn)的操作指南與分步驟講解
      • 更強(qiáng)的技術(shù)寫(xiě)作與翻譯能力
      • 更好地支持學(xué)習(xí)與職業(yè)規(guī)劃

      GPT-5.2 Thinking,為專業(yè)級(jí)工作全面提升標(biāo)準(zhǔn):

      • 業(yè)界最先進(jìn)的長(zhǎng)上下文推理能力
      • 在電子表格的生成、分析與排版方面取得重大提升
      • 在演示文稿制作方面已有初步突破

      GPT-5.2 Pro,在面對(duì)困難問(wèn)題時(shí)最聰明、最值得信賴的模型:

      • 在編程等復(fù)雜領(lǐng)域表現(xiàn)更強(qiáng)
      • 最適合幫助并加速科學(xué)研究的模型

      GPT-5.2 的設(shè)計(jì)目標(biāo),就是為人們創(chuàng)造更多經(jīng)濟(jì)價(jià)值:它在制作電子表格、構(gòu)建演示文稿、編寫(xiě)代碼、理解圖像、處理超長(zhǎng)上下文、使用工具,以及執(zhí)行復(fù)雜的多步驟項(xiàng)目方面都有顯著提升。

      真正的生產(chǎn)力不是空口無(wú)憑,讓我們來(lái)看看數(shù)據(jù),GPT-5.2 到底有多強(qiáng)。

      在如圖所示的眾多基準(zhǔn)測(cè)試中,GPT-5.2 均刷新了最新的 SOTA 水平。



      你可以注意到,AIME 2025(數(shù)學(xué))的分?jǐn)?shù)是 100%,之前 Gemini 3 Pro 的分?jǐn)?shù)是 95%;ARC-AGI-2(抽象推理)的分?jǐn)?shù)是 52.9%,對(duì)比 Gemini 3 Pro 是 31.1 %;此外 SWE-bench pro(編碼)的分?jǐn)?shù)是 55.6%,對(duì)比 Gemini 3 Pro 是 43.3 %。



      GPT-5.2 在 GDPval(知識(shí)工作)基準(zhǔn)上的分?jǐn)?shù)為 74.1%,OpenAI 聲稱這是 AI 模型首次達(dá)到了「人類專家水平」。

      總體來(lái)看,GPT-5.2 在通用智能、長(zhǎng)上下文理解、自主式工具調(diào)用以及視覺(jué)能力方面均帶來(lái)了顯著提升,使其比以往任何模型都更擅長(zhǎng)端到端地完成復(fù)雜的真實(shí)世界任務(wù)。

      山姆?奧特曼表示,GPT-5.2 是 OpenAI 很長(zhǎng)一段時(shí)間以來(lái)最大的一次升級(jí)。

      真正的生產(chǎn)力

      GPT-5.2 Thinking 是迄今為止最適合真實(shí)世界專業(yè)場(chǎng)景的模型。在 GDPval—— 一個(gè)覆蓋 44 個(gè)職業(yè)、針對(duì)明確知識(shí)工作任務(wù)的評(píng)估體系中,GPT-5.2 Thinking 刷新了 SOTA 成績(jī),并成為 OpenAI 首個(gè)整體表現(xiàn)達(dá)到或超過(guò)人類專家水平的模型。

      根據(jù)專業(yè)評(píng)審的判斷,在 GDPval 的知識(shí)工作任務(wù)對(duì)比中,GPT-5.2 Thinking 在 70.9% 的對(duì)比中擊敗或與頂尖行業(yè)專家持平。這些任務(wù)包括制作演示文稿、電子表格以及其他專業(yè)產(chǎn)出物。

      在執(zhí)行 GDPval 任務(wù)時(shí),GPT-5.2 Thinking 生成輸出的速度超過(guò)專家 11 倍以上,成本卻低于 1%。這表明,在配合人工監(jiān)督時(shí),GPT-5.2 能顯著輔助專業(yè)工作。

      速度和成本估算基于歷史數(shù)據(jù);ChatGPT 中的實(shí)際速度可能有所差異。



      在 GDPval 中,模型需要完成覆蓋美國(guó) GDP 貢獻(xiàn)度最高的 9 大行業(yè)中 44 個(gè)職業(yè)的、明確規(guī)定的知識(shí)工作任務(wù)。這些任務(wù)要求生成真實(shí)的工作產(chǎn)出,例如:銷售演示文稿、會(huì)計(jì)報(bào)表 / 電子表格、急診排班表、制造流程圖,甚至是短視頻等。在 ChatGPT 中,GPT-5.2 Thinking 配備了 GPT-5 Thinking 所不具備的新工具。

      在評(píng)審一份表現(xiàn)尤其出色的輸出時(shí),一位 GDPval 評(píng)委評(píng)論道:

      「這是一次令人興奮且明顯的質(zhì)量飛躍……[它] 看起來(lái)就像是由一家專業(yè)公司團(tuán)隊(duì)完成的,兩個(gè)交付物的版式設(shè)計(jì)和建議都出乎意料地優(yōu)秀,不過(guò)其中一個(gè)仍有一些小錯(cuò)誤需要修正。」

      此外,在 OpenAI 內(nèi)部用于測(cè)試初級(jí)投行分析師能力的電子表格建模基準(zhǔn)中(例如:為一家財(cái)富 500 強(qiáng)企業(yè)構(gòu)建包含三張財(cái)務(wù)報(bào)表的模型,并具備正確格式和引用;或?yàn)樗接谢灰讟?gòu)建杠桿收購(gòu)模型),GPT-5.2 Thinking 的任務(wù)平均得分比 GPT-5.1 提升了 9.3%,從 59.1% 上升到 68.4%。

      對(duì)比顯示,GPT-5.2 Thinking 在生成電子表格與演示文稿時(shí),在專業(yè)度與排版質(zhì)量上都有顯著提升:



      Prompt: Create a workforce planning model: headcount, hiring plan, attrition, and budget impact. Include engineering, marketing, legal, and sales departments.



      5.1 錯(cuò)誤地計(jì)算了種子輪、A 輪和 B 輪的清算優(yōu)先權(quán),并且將這些行的大部分留空,導(dǎo)致最終的股權(quán)分配計(jì)算結(jié)果不正確。它還在表頭行中錯(cuò)誤地插入了公式。5.2 則完整且準(zhǔn)確地完成了所有計(jì)算,并以可審計(jì)的方式呈現(xiàn)結(jié)果。



      要在 ChatGPT 中使用新的電子表格和演示文稿生成功能,您需要使用 Plus、Pro、Business 或 Enterprise 方案,并選擇 GPT-5.2 Thinking 或 GPT-5.2 Pro。復(fù)雜內(nèi)容的生成可能需要數(shù)分鐘時(shí)間。

      新的編碼高峰

      GPT-5.2 Thinking 在 SWE-Bench Pro 上取得 55.6% 的最新 SOTA 成績(jī)。

      SWE-Bench Pro 是一個(gè)嚴(yán)格評(píng)估真實(shí)世界軟件工程能力的基準(zhǔn)。與只測(cè)試 Python 的 SWE-bench Verified 不同,SWE-Bench Pro 涵蓋四種編程語(yǔ)言,并設(shè)計(jì)得更具抗污染性、挑戰(zhàn)性、多樣性和工業(yè)相關(guān)性。



      在 SWE-Bench Pro 中,模型會(huì)獲得一個(gè)代碼倉(cāng)庫(kù),并必須生成補(bǔ)丁(patch)來(lái)解決一個(gè)真實(shí)的軟件工程任務(wù)。

      在 SWE-bench Verified 上,GPT-5.2 Thinking 取得了 80% 的新的最高分。

      對(duì)于日常專業(yè)使用來(lái)說(shuō),這意味著模型在以下方面更加可靠:調(diào)試生產(chǎn)環(huán)境代碼、實(shí)現(xiàn)功能請(qǐng)求、重構(gòu)大型代碼庫(kù),以及以更少人工干預(yù)的方式完成端到端修復(fù)。

      GPT-5.2 Thinking 在前端工程能力上也優(yōu)于 GPT-5.1 Thinking。早期測(cè)試者發(fā)現(xiàn),它在前端開(kāi)發(fā)以及復(fù)雜或非常規(guī)的 UI 設(shè)計(jì)(尤其是包含 3D 元素 的界面)方面的能力顯著增強(qiáng),使其成為全棧工程師的強(qiáng)大日常助手。

      以下是它根據(jù)單條提示詞即可生成的部分示例:







      新的幻覺(jué)低谷

      GPT-5.2 Thinking 的幻覺(jué)率顯著低于 GPT-5.1 Thinking。

      在一組來(lái)自 ChatGPT 的去標(biāo)識(shí)化真實(shí)用戶查詢上,含錯(cuò)誤的回答相對(duì)減少了 30%

      對(duì)于專業(yè)用戶而言,這意味著在進(jìn)行研究、寫(xiě)作、分析和決策支持時(shí),模型犯錯(cuò)更少,從而讓日常知識(shí)工作更加可靠穩(wěn)健。



      推理力度被設(shè)置為可用的最高級(jí)別,并啟用了搜索工具。錯(cuò)誤由其他模型檢測(cè),而這些模型本身也可能會(huì)出錯(cuò)。在主張級(jí)別(claim-level)的錯(cuò)誤率遠(yuǎn)低于回答級(jí)別(response-level)的錯(cuò)誤率,因?yàn)榇蠖鄶?shù)回答都包含多個(gè)獨(dú)立主張。

      擺脫上下文限制

      GPT-5.2 Thinking 在長(zhǎng)上下文推理方面達(dá)到了新的業(yè)界最先進(jìn)水平,在 OpenAI MRCRv2 上取得領(lǐng)先表現(xiàn) —— 這是一個(gè)用于測(cè)試模型整合長(zhǎng)文檔中分散信息能力的評(píng)估基準(zhǔn)。在真實(shí)世界任務(wù)(如深度文檔分析)中,當(dāng)相關(guān)信息分布在數(shù)十萬(wàn) token 中時(shí),GPT-5.2 Thinking 的準(zhǔn)確性顯著優(yōu)于 GPT-5.1 Thinking。

      特別值得注意的是,GPT-5.2 Thinking 是 OpenAI 首個(gè)在 4-needle MRCR 變體(長(zhǎng)度可達(dá) 256k tokens)上達(dá)到接近 100% 準(zhǔn)確率的模型。

      從實(shí)際應(yīng)用來(lái)看,這意味著專業(yè)人士可以使用 GPT-5.2 來(lái)處理超長(zhǎng)文檔 —— 例如報(bào)告、合同、科研論文、訪談?dòng)涗浺约岸辔募?xiàng)目 —— 同時(shí)在數(shù)十萬(wàn) token 的跨段信息中保持連貫性和準(zhǔn)確性。這讓 GPT-5.2 尤其適合深度分析、綜合推理以及復(fù)雜的多來(lái)源工作流。





      在 OpenAI-MRCR v2(多輪共指消解)評(píng)測(cè)中,會(huì)將多個(gè)相同的「針」(needle)式用戶請(qǐng)求插入到由大量類似請(qǐng)求與回復(fù)構(gòu)成的長(zhǎng)「草堆」(haystacks)中,然后要求模型復(fù)現(xiàn)第 n 個(gè)針對(duì)應(yīng)的回答。Mean match ratio(平均匹配率) 用于衡量模型回答與正確答案之間的平均字符串匹配程度。圖中 256k 最大輸入 token 的點(diǎn)代表對(duì) 128k–256k token 輸入范圍的平均表現(xiàn),以此類推。其中 256k 表示 256 × 1,024 = 262,144 token。推理力度被設(shè)置為可用的最高級(jí)別。

      對(duì)于那些需要在最大上下文窗口之外繼續(xù)推理的任務(wù),GPT-5.2 Thinking 兼容我們新的 Responses /compact 端點(diǎn),它能夠擴(kuò)展模型的有效上下文窗口。

      這使得 GPT-5.2 Thinking 可以處理更多依賴工具、運(yùn)行時(shí)間較長(zhǎng)的工作流,而不會(huì)受到上下文長(zhǎng)度的限制。

      精細(xì)的視覺(jué)理解

      OpenAI 表示:「GPT-5.2 Thinking 是我們要目前最強(qiáng)的視覺(jué)模型,在圖表推理和軟件界面理解方面的錯(cuò)誤率幾乎降低了一半。」

      對(duì)于日常的專業(yè)應(yīng)用而言,這意味著該模型能夠更準(zhǔn)確地解讀儀表盤(pán)、產(chǎn)品截屏、技術(shù)圖表和視覺(jué)報(bào)告,從而為金融、運(yùn)營(yíng)、工程、設(shè)計(jì)以及客戶支持等以視覺(jué)信息為核心的工作流提供強(qiáng)力支持。



      在 CharXiv Reasoning 中,模型需要回答關(guān)于科學(xué)論文中視覺(jué)圖表的問(wèn)題。測(cè)試中啟用了 Python 工具,并將推理強(qiáng)度(reasoning effort)設(shè)為最大。



      在 ScreenSpot-Pro 中,模型必須對(duì)來(lái)自各種專業(yè)環(huán)境的高分辨率圖形用戶界面(GUI)截圖進(jìn)行推理。測(cè)試中啟用了 Python 工具,并將推理強(qiáng)度設(shè)為最大。如果不使用 Python 工具,得分會(huì)低得多。OpenAI 建議在此類視覺(jué)任務(wù)上啟用 Python 工具。

      與之前的模型相比,GPT-5.2 Thinking 對(duì)圖像中各元素的位置關(guān)系理解得更加透徹,這對(duì)于「相對(duì)布局」在解決問(wèn)題中起關(guān)鍵作用的任務(wù)尤為重要。

      在下方的示例中,OpenAI 要求模型識(shí)別輸入圖像(本例中為主板)中的組件,并返回帶有大致邊界框的標(biāo)簽。即使在低質(zhì)量圖像上,GPT-5.2 也能識(shí)別出主要區(qū)域,并放置有時(shí)能與每個(gè)組件真實(shí)位置相匹配的框;而 GPT-5.1 僅標(biāo)記了少數(shù)幾個(gè)部分,且對(duì)其空間排列的理解要弱得多。



      很明顯,兩個(gè)模型都存在錯(cuò)誤,但 GPT-5.2 展示出了對(duì)圖像更好的理解力。

      可靠的工具調(diào)用

      GPT-5.2 Thinking 在 Tau2-bench Telecom 上取得了 98.7% 的新 SOTA 成績(jī),展示了其在長(zhǎng)鏈路、多輪任務(wù)中可靠使用工具的能力。

      對(duì)于延遲敏感的用例,GPT-5.2 Thinking 在 reasoning.effort='none'(不進(jìn)行額外推理思考)模式下的表現(xiàn)也要好得多,大幅優(yōu)于 GPT-5.1 和 GPT-4.1。



      在 τ2-bench 中,模型需要使用工具與模擬用戶進(jìn)行多輪交互,以完成客戶支持任務(wù)。對(duì)于電信領(lǐng)域,OpenAI 在系統(tǒng)提示詞中包含了一條簡(jiǎn)短且通用的指導(dǎo)說(shuō)明以提升性能。由于航空子集的基準(zhǔn)真實(shí)標(biāo)簽評(píng)分質(zhì)量較低,OpenAI 將其排除在外。

      對(duì)于專業(yè)人士來(lái)說(shuō),這可以轉(zhuǎn)化為更強(qiáng)大的端到端工作流 —— 例如解決客戶支持案例、從多個(gè)系統(tǒng)提取數(shù)據(jù)、運(yùn)行分析以及生成最終輸出,且步驟之間的斷裂或阻滯更少。

      例如,當(dāng)詢問(wèn)一個(gè)需要多步解決的復(fù)雜客服問(wèn)題時(shí),模型可以更有效地協(xié)調(diào)跨多個(gè)智能體的完整工作流。

      在下面的案例中,一位旅客報(bào)告了航班延誤、錯(cuò)過(guò)了轉(zhuǎn)機(jī)、需要在紐約過(guò)夜以及醫(yī)療座位需求。GPT-5.2 管理了整個(gè)任務(wù)鏈(重新預(yù)訂、特殊協(xié)助座位和賠償),提供了比 GPT-5.1 更完整的結(jié)果。

      「我從巴黎到紐約的航班延誤了,導(dǎo)致我錯(cuò)過(guò)了去奧斯汀的轉(zhuǎn)機(jī)。我的托運(yùn)行李也不見(jiàn)了,我需要在紐約過(guò)夜。此外,因?yàn)獒t(yī)療原因我還需要一個(gè)特殊的前排座位。你能幫我嗎?」



      探索科學(xué)與數(shù)學(xué)邊界

      OpenAI 表示其對(duì) AI 的愿景之一,是希望它能加速科學(xué)研究,造福每一個(gè)人。為此,OpenAI 一直與科學(xué)家合作并傾聽(tīng)他們的意見(jiàn),探索 AI 如何能加速他們的工作。

      上個(gè)月,OpenAI 在論文《Early experiments in accelerating science with GPT-5》中分享了一些早期的合作實(shí)驗(yàn)。

      OpenAI 表示:「我們相信 GPT-5.2 Pro 和 GPT-5.2 Thinking 是目前世界上輔助和加速科學(xué)家工作的最佳模型。」

      在 GPQA Diamond(一個(gè)研究生級(jí)別的「防谷歌搜索」問(wèn)答基準(zhǔn)測(cè)試)上,GPT-5.2 Pro 達(dá)到了 93.2%,GPT-5.2 Thinking 緊隨其后,達(dá)到了 92.4%。



      在 GPQA Diamond 中,模型需要回答關(guān)于物理、化學(xué)和生物的多項(xiàng)選擇題。測(cè)試中未啟用工具,并將推理強(qiáng)度設(shè)為最大。

      在 FrontierMath (Tier 1–3) 這一專家級(jí)數(shù)學(xué)評(píng)估中,GPT-5.2 Thinking 創(chuàng)下了新的 SOTA,解決了 40.3% 的問(wèn)題。



      在 FrontierMath 中,模型解決專家級(jí)數(shù)學(xué)問(wèn)題。測(cè)試中啟用了 Python 工具,并將推理強(qiáng)度設(shè)為最大。

      OpenAI 表示:「我們開(kāi)始看到 AI 模型以切實(shí)可見(jiàn)的方式有意義地加速數(shù)學(xué)和科學(xué)的進(jìn)步。例如,在最近使用 GPT-5.2 Pro 的一項(xiàng)工作中,研究人員探索了統(tǒng)計(jì)學(xué)習(xí)理論中的一個(gè)開(kāi)放性問(wèn)題。在一個(gè)狹窄且定義明確的設(shè)定中,模型提出了一個(gè)證明,隨后該證明被作者驗(yàn)證并由外部專家審查,這生動(dòng)地說(shuō)明了前沿模型如何在密切的人類監(jiān)督下輔助數(shù)學(xué)研究。」

      通用推理 ARC-AGI 2

      在 ARC-AGI-1 (Verified)(一個(gè)旨在衡量通用推理能力的基準(zhǔn)測(cè)試)上,GPT-5.2 Pro 是首個(gè)突破 90% 門(mén)檻的模型。相比去年 o3-preview 達(dá)到的 87%,它不僅實(shí)現(xiàn)了性能提升,還將達(dá)成該性能的成本降低了約 390 倍。

      在 ARC-AGI-2 (Verified) 上(該測(cè)試提高了難度并更好地隔離了流體推理能力(fluid reasoning)),GPT-5.2 Thinking 取得了思維鏈模型的新 SOTA,得分為 52.9%。GPT-5.2 Pro 的表現(xiàn)甚至更高,達(dá)到了 54.2%,進(jìn)一步擴(kuò)展了模型對(duì)新穎、抽象問(wèn)題進(jìn)行推理的能力。

      在這些評(píng)估中的提升,反映了 GPT-5.2 更強(qiáng)的多步推理能力、更高的定量準(zhǔn)確性,以及在處理復(fù)雜技術(shù)任務(wù)時(shí)更可靠的問(wèn)題解決能力。

      在 ChatGPT 中使用 GPT-5.2

      OpenAI 表示:「在 ChatGPT 中,用戶應(yīng)該會(huì)注意到 GPT-5.2 的日常使用體驗(yàn)更佳 —— 它更有條理、更可靠,且對(duì)話體驗(yàn)依然令人愉悅。」

      該公司給 GPT-5.2 Instant 的定位是日常工作和學(xué)習(xí)的快速、強(qiáng)力助手。它延續(xù)了 GPT-5.1 Instant 引入的更溫暖的對(duì)話基調(diào),并在信息搜尋、實(shí)操指南與分步教程、技術(shù)寫(xiě)作以及翻譯方面有明顯改進(jìn)。早期測(cè)試者特別指出,其解釋更加清晰,能夠?qū)㈥P(guān)鍵信息前置。

      GPT-5.2 Thinking 專為深度工作設(shè)計(jì),幫助用戶以更高的完成度處理更復(fù)雜的任務(wù) —— 特別是在代碼編寫(xiě)、長(zhǎng)文檔總結(jié)、基于上傳文件的問(wèn)答、逐步處理數(shù)學(xué)和邏輯問(wèn)題,以及通過(guò)更清晰的結(jié)構(gòu)和更實(shí)用的細(xì)節(jié)支持規(guī)劃與決策方面。

      GPT-5.2 Pro 是 OpenAI 處理難題時(shí)最聰明、最值得信賴的選擇。對(duì)于那些值得等待的高質(zhì)量回答,它表現(xiàn)最佳。早期測(cè)試顯示,其在編程等復(fù)雜領(lǐng)域的重大錯(cuò)誤更少,表現(xiàn)更強(qiáng)。

      安全

      GPT-5.2 基于 OpenAI 在 GPT-5 中引入的「安全完成」研究,該研究旨在教會(huì) AI 模型在確保安全的前提下,給出最有幫助的答案。

      據(jù)說(shuō)在此版本中,研究人員繼續(xù)致力于增強(qiáng)模型在敏感對(duì)話中的響應(yīng)能力,顯著改進(jìn)了模型對(duì)提示自殺或自殘跡象、心理健康困擾或?qū)δP偷那楦幸蕾嚨葐?wèn)題的響應(yīng)。與 GPT-5.1 和 GPT-5 Instant 及 Thinking 模型相比,這些針對(duì)性的干預(yù)措施顯著減少了 GPT-5.2 Instant 和 GPT-5.2 Thinking 模型的不良響應(yīng)。

      OpenAI 提到,GPT-5.2 能夠自動(dòng)為 18 歲以下用戶應(yīng)用內(nèi)容保護(hù),從而限制他們?cè)L問(wèn)敏感內(nèi)容。



      定價(jià)

      ChatGPT 將于今日開(kāi)始逐步推出 GPT-5.2(包括 Instant、Thinking 和 Pro 版本),首先面向付費(fèi)用戶(Plus、Pro、Go、Business 和 Enterprise 版本)提供。為確保 ChatGPT 的流暢性和穩(wěn)定性,GPT-5.2 將分階段部署,可能有人第一時(shí)間無(wú)法看到。在 ChatGPT 中,付費(fèi)用戶仍可在三個(gè)月內(nèi)繼續(xù)使用 GPT-5.1(舊版模式),之后 GPT-5.1 將逐步下線。



      在 API 平臺(tái)上,GPT-5.2 Thinking 以 gpt-5.2 的名義提供,GPT-5.2 Instant 則以 gpt-5.2-chat-latest 的名稱提供。GPT-5.2 Pro 以 gpt-5.2-pro 的名稱提供。開(kāi)發(fā)者現(xiàn)在可以在 GPT-5.2 Pro 中設(shè)置推理參數(shù),并且 GPT-5.2 Pro 和 GPT-5.2 Thinking 均支持新的第五級(jí)推理難度 xhigh,適用于對(duì)質(zhì)量要求極高的任務(wù)。

      以下是百萬(wàn) token 的價(jià)格,OpenAI 稱,盡管 GPT-5.2 的單個(gè) token 成本更高,但由于其更高的 token 效率,達(dá)到特定質(zhì)量水平的總成本反而更低。

      ChatGPT 的訂閱價(jià)格保持不變。



      OpenAI 表示,目前沒(méi)有計(jì)劃在 API 中棄用 GPT-5.1、GPT-5 或 GPT-4.1。雖然 GPT-5.2 在 Codex 中開(kāi)箱即用,但 OpenAI 還預(yù)計(jì)將在未來(lái)幾周內(nèi)發(fā)布一個(gè)針對(duì) Codex 優(yōu)化的 GPT-5.2 版本。

      GPT-5.2 是 OpenAI 與長(zhǎng)期合作伙伴英偉達(dá)和 Microsoft 合作開(kāi)發(fā)的。Azure 數(shù)據(jù)中心和英偉達(dá) GPU(包括 H100、H200 和 GB200-NVL72)為 OpenAI 的大規(guī)模訓(xùn)練基礎(chǔ)設(shè)施提供了支撐。

      OpenAI 十周年

      今天是 OpenAI 十歲生日,發(fā)布新模型的同時(shí),創(chuàng)始人、CEO 山姆?奧特曼撰文說(shuō)道:

      OpenAI 取得的成就遠(yuǎn)超我的想象;我們當(dāng)初的目標(biāo)是做一些瘋狂的、幾乎不可能的、前所未有的事情。從充滿不確定性的開(kāi)端,克服重重困難,憑借持續(xù)不斷的努力,我們現(xiàn)在看來(lái)很有可能實(shí)現(xiàn)我們的使命。

      十年前的今天,我們向世界宣布了我們的計(jì)劃,盡管我們當(dāng)時(shí)并沒(méi)有正式啟動(dòng)。又過(guò)了幾個(gè)星期,直到 2016 年 1 月初(才正式開(kāi)始)。

      從某種意義上說(shuō),十年是一段很長(zhǎng)的時(shí)間,但就社會(huì)變革通常所需的時(shí)間而言,十年其實(shí)并不算長(zhǎng)。雖然日常生活與十年前并沒(méi)有太大的不同,但我們今天所面臨的可能性空間,與我們當(dāng)年十五個(gè)書(shū)呆子圍坐在一起,苦思冥想如何取得進(jìn)步時(shí)所感受到的截然不同。

      回看早期的照片,我首先注意到的是大家看起來(lái)都好年輕。但隨后,我又注意到大家那種異乎尋常的樂(lè)觀和快樂(lè)。那是一段瘋狂而又充滿樂(lè)趣的時(shí)光:盡管我們不被人理解,但我們卻有著堅(jiān)定的信念,覺(jué)得這件事意義非凡,即使成功的機(jī)會(huì)渺茫也值得全力以赴;我們擁有才華橫溢的人,以及清晰的目標(biāo)。

      隨著我們?nèi)〉靡恍┏晒Γㄒ约霸S多失敗),我們逐漸對(duì)現(xiàn)狀有了更清晰的認(rèn)識(shí)。那時(shí),要確定具體應(yīng)該做什么并不容易,但我們建立了一種鼓勵(lì)探索的卓越文化。深度學(xué)習(xí)無(wú)疑是一項(xiàng)偉大的技術(shù),但如果沒(méi)有在現(xiàn)實(shí)世界中積累應(yīng)用經(jīng)驗(yàn)就貿(mào)然開(kāi)發(fā),似乎不太合適。我在此略過(guò)我們所做的一切(希望將來(lái)有人能寫(xiě)成一部歷史著作),但我們始終秉持著一種積極進(jìn)取的精神,不斷探索眼前的下一個(gè)挑戰(zhàn):研究的下一步方向是什么?如何籌集資金購(gòu)買(mǎi)更強(qiáng)大的計(jì)算機(jī)?等等。我們率先開(kāi)展了使人工智能安全可靠且切實(shí)可行的技術(shù)工作,這種精神一直延續(xù)至今。

      2017 年,我們?nèi)〉昧艘恍┑旎缘某晒篋ota 1v1 的實(shí)驗(yàn)結(jié)果,將強(qiáng)化學(xué)習(xí)推向了新的規(guī)模;無(wú)監(jiān)督情感神經(jīng)元實(shí)驗(yàn),證明語(yǔ)言模型能夠清晰地學(xué)習(xí)語(yǔ)義,而不僅僅是語(yǔ)法;基于人類偏好的強(qiáng)化學(xué)習(xí)成果,展示了將人工智能與人類價(jià)值觀相契合的初步途徑。當(dāng)時(shí),創(chuàng)新遠(yuǎn)未結(jié)束,但我們深知,需要借助強(qiáng)大的計(jì)算能力來(lái)擴(kuò)展這些成果。

      我們堅(jiān)持不懈,不斷改進(jìn)技術(shù),并在三年前推出了 ChatGPT。世界為之矚目,而 GPT-4 的發(fā)布更是引起了廣泛關(guān)注;突然之間,通用人工智能(AGI)不再是天方夜譚。過(guò)去的三年極其緊張,壓力巨大,責(zé)任重大;這項(xiàng)技術(shù)以前所未有的規(guī)模和速度融入了世界。這需要極其高超的執(zhí)行力,我們必須迅速培養(yǎng)新的能力來(lái)應(yīng)對(duì)。在如此短的時(shí)間內(nèi)從零發(fā)展成為一家龐大的公司絕非易事,我們每周都要做出數(shù)百個(gè)決策。我為團(tuán)隊(duì)做出的眾多正確決策感到自豪,而那些錯(cuò)誤決策大多是我的責(zé)任。

      我們不得不做出一些新的決策;例如,在思考如何讓 AI 最大限度地造福世界時(shí),我們制定了一項(xiàng)迭代部署策略,將早期版本的技術(shù)成功推向市場(chǎng),讓人們形成認(rèn)知,社會(huì)與技術(shù)共同演進(jìn)。這在當(dāng)時(shí)頗具爭(zhēng)議,但我認(rèn)為這是我們做出的最明智的決策之一,如今已成為行業(yè)標(biāo)準(zhǔn)。

      OpenAI 成立十年以來(lái),我們擁有的 AI 能夠在最艱難的智力競(jìng)賽中勝過(guò)我們大多數(shù)最聰明的人。

      世界已經(jīng)利用這項(xiàng)技術(shù)創(chuàng)造了非凡的成就,我們期待明年還能看到更多非凡的成果。迄今為止,世界在減輕潛在的負(fù)面影響方面也做得不錯(cuò),我們需要繼續(xù)努力,保持這種勢(shì)頭。

      我從未像現(xiàn)在這樣對(duì)我們的研發(fā)和產(chǎn)品路線圖,以及實(shí)現(xiàn)我們使命的整體方向感到如此樂(lè)觀。我相信,再過(guò)十年,我們幾乎肯定能夠打造出超級(jí)智能。我預(yù)感未來(lái)會(huì)有些奇特;在某種程度上,日常生活和我們最關(guān)心的事情幾乎不會(huì)發(fā)生太大變化,而且我相信,我們會(huì)繼續(xù)更加關(guān)注其他人所做的事情,而不是機(jī)器所做的事情。但在另一方面,2035 年的人們將能夠做到我們現(xiàn)在難以想象的事情。

      衷心感謝那些信任我們并使用我們的產(chǎn)品創(chuàng)造佳績(jī)的個(gè)人和公司。如果沒(méi)有他們的支持,我們或許還只是實(shí)驗(yàn)室里的一項(xiàng)技術(shù);我們的用戶和客戶在很多情況下都對(duì)我們寄予了過(guò)高的期望,沒(méi)有他們的支持,我們的工作不可能達(dá)到今天的成就。

      我們的使命是確保 AGI 造福全人類。面前還有很多工作要做,但我為團(tuán)隊(duì)目前的發(fā)展方向感到非常自豪。我們已經(jīng)看到人們利用這項(xiàng)技術(shù)所取得的巨大成果,而且我們知道,未來(lái)幾年還將有更多成果涌現(xiàn)。

      參考內(nèi)容:

      https://openai.com/index/introducing-gpt-5-2/

      https://openai.com/index/ten-years/

      GPT 5.2 System Card:

      https://cdn.openai.com/pdf/3a4153c8-c748-4b71-8e31-aecbde944f8d/oai_5_2_system-card.pdf

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      太尷尬!某單位一把手調(diào)離,在群里發(fā)臨別感言,整整2天無(wú)人回應(yīng)

      太尷尬!某單位一把手調(diào)離,在群里發(fā)臨別感言,整整2天無(wú)人回應(yīng)

      火山詩(shī)話
      2025-08-08 15:17:30
      仇英《江南春》之謎要早日查清,這關(guān)乎文博機(jī)構(gòu)的公信力|鋒面評(píng)論

      仇英《江南春》之謎要早日查清,這關(guān)乎文博機(jī)構(gòu)的公信力|鋒面評(píng)論

      上觀新聞
      2025-12-18 12:27:05
      哈佛研究發(fā)現(xiàn):情緒不好,不是性格問(wèn)題,是生理問(wèn)題。

      哈佛研究發(fā)現(xiàn):情緒不好,不是性格問(wèn)題,是生理問(wèn)題。

      小卿情感說(shuō)
      2025-12-01 23:21:49
      花費(fèi)1億請(qǐng)趙本山代言,成本2毛騙農(nóng)戶200億,創(chuàng)始人被判無(wú)期徒刑

      花費(fèi)1億請(qǐng)趙本山代言,成本2毛騙農(nóng)戶200億,創(chuàng)始人被判無(wú)期徒刑

      法老不說(shuō)教
      2025-12-17 20:08:06
      CCTV5直播,廣東男籃PK廣州龍獅,杜鋒斗法米歇爾,鹿死誰(shuí)手?

      CCTV5直播,廣東男籃PK廣州龍獅,杜鋒斗法米歇爾,鹿死誰(shuí)手?

      體壇小快靈
      2025-12-18 16:07:14
      聰明反被聰明誤!本想為女兒鋪路的李湘,卻栽在了何超瓊手里

      聰明反被聰明誤!本想為女兒鋪路的李湘,卻栽在了何超瓊手里

      觀察鑒娛
      2025-12-18 09:43:05
      中央定調(diào),延遲退休實(shí)施!男職工2026年1月和5月退休,哪種領(lǐng)的多

      中央定調(diào),延遲退休實(shí)施!男職工2026年1月和5月退休,哪種領(lǐng)的多

      八斗小先生
      2025-12-18 14:49:44
      結(jié)束了!朱拉尼宣布重磅消息,敘利亞人狂歡:終于不用提心吊膽了

      結(jié)束了!朱拉尼宣布重磅消息,敘利亞人狂歡:終于不用提心吊膽了

      沈言論
      2025-12-15 16:15:03
      今晚,珠海全市夜查!

      今晚,珠海全市夜查!

      珠海發(fā)布
      2025-12-18 09:41:05
      哈佛大學(xué)驚奇發(fā)現(xiàn):壽命和晚飯有關(guān)!晚飯吃的越多,活的就越久?

      哈佛大學(xué)驚奇發(fā)現(xiàn):壽命和晚飯有關(guān)!晚飯吃的越多,活的就越久?

      阿捤武器裝備科普
      2025-12-16 19:00:35
      龍虎局 3:飯店火拼

      龍虎局 3:飯店火拼

      金昔說(shuō)故事
      2025-12-18 16:25:13
      歷史開(kāi)了個(gè)玩笑,第一個(gè)倒下的不是烏克蘭,而是百年中立的瑞士

      歷史開(kāi)了個(gè)玩笑,第一個(gè)倒下的不是烏克蘭,而是百年中立的瑞士

      壹知眠羊
      2025-12-15 07:11:38
      A股,兩個(gè)利空信號(hào)傳來(lái),明天,或?qū)⒂瓉?lái)變盤(pán)大跳水!

      A股,兩個(gè)利空信號(hào)傳來(lái),明天,或?qū)⒂瓉?lái)變盤(pán)大跳水!

      夜深愛(ài)雜談
      2025-12-18 16:46:32
      她靠一部劇吃一輩子,二婚嫁小6歲窮小子,如今丈夫紅到讓人嫉妒

      她靠一部劇吃一輩子,二婚嫁小6歲窮小子,如今丈夫紅到讓人嫉妒

      白面書(shū)誏
      2025-12-16 18:30:25
      絲芭傳媒發(fā)“最后告知”:藝人鞠婧祎涉嫌嚴(yán)重經(jīng)濟(jì)犯罪,將擇日全網(wǎng)公開(kāi)實(shí)名舉報(bào)!她剛被曝1.39億元收入,還有每月25萬(wàn)元固定工資

      絲芭傳媒發(fā)“最后告知”:藝人鞠婧祎涉嫌嚴(yán)重經(jīng)濟(jì)犯罪,將擇日全網(wǎng)公開(kāi)實(shí)名舉報(bào)!她剛被曝1.39億元收入,還有每月25萬(wàn)元固定工資

      每日經(jīng)濟(jì)新聞
      2025-12-18 14:49:08
      中日聯(lián)合國(guó)激烈交鋒,日本拒絕認(rèn)錯(cuò),中方再下通牒,要求撤回言論

      中日聯(lián)合國(guó)激烈交鋒,日本拒絕認(rèn)錯(cuò),中方再下通牒,要求撤回言論

      起喜電影
      2025-12-18 14:53:49
      高市早苗連續(xù)2天喊話中國(guó),承認(rèn)自己該反思,希望與中方高層對(duì)話

      高市早苗連續(xù)2天喊話中國(guó),承認(rèn)自己該反思,希望與中方高層對(duì)話

      南宮一二
      2025-12-18 13:20:50
      轟22+7奪連勝!中國(guó)男籃18歲2米03新星留美爆發(fā):手握4所大學(xué)邀約

      轟22+7奪連勝!中國(guó)男籃18歲2米03新星留美爆發(fā):手握4所大學(xué)邀約

      李喜林籃球絕殺
      2025-12-18 13:38:53
      因商業(yè)環(huán)境惡化,瓜迪奧拉即將永久關(guān)閉在曼市開(kāi)了7年的餐廳

      因商業(yè)環(huán)境惡化,瓜迪奧拉即將永久關(guān)閉在曼市開(kāi)了7年的餐廳

      懂球帝
      2025-12-18 06:43:09
      江蘇一中學(xué)原黨總支書(shū)記、校長(zhǎng)侵吞“校園餐”,9人被處理

      江蘇一中學(xué)原黨總支書(shū)記、校長(zhǎng)侵吞“校園餐”,9人被處理

      環(huán)球網(wǎng)資訊
      2025-12-18 09:25:03
      2025-12-18 18:04:49
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      11947文章數(shù) 142512關(guān)注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創(chuàng)業(yè)大賽

      頭條要聞

      南京博物院稱受贈(zèng)5幅畫(huà)被鑒定為"假" 捐贈(zèng)者后人回應(yīng)

      頭條要聞

      南京博物院稱受贈(zèng)5幅畫(huà)被鑒定為"假" 捐贈(zèng)者后人回應(yīng)

      體育要聞

      巴黎首奪世界級(jí)冠軍 加冕6冠王比肩巴薩拜仁

      娛樂(lè)要聞

      絲芭放大招了!實(shí)名舉報(bào)鞠婧祎經(jīng)濟(jì)犯罪

      財(cái)經(jīng)要聞

      尹艷林:呼吁加快2.5億新市民落戶進(jìn)程

      汽車(chē)要聞

      在零下30℃的考場(chǎng)里 凡爾賽C5 X和508L拿到了"穩(wěn)"的證明

      態(tài)度原創(chuàng)

      游戲
      本地
      房產(chǎn)
      公開(kāi)課
      軍事航空

      好評(píng)新游《滑板故事》作者:滑板本身就讓人沮喪

      本地新聞

      云游安徽|決戰(zhàn)烽火照古今,千秋一脈看宿州

      房產(chǎn)要聞

      太強(qiáng)了!封關(guān)時(shí)刻,兩天砸下50億!央企綠發(fā),重倉(cāng)三亞!

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      福建艦入列后首過(guò)臺(tái)海 臺(tái)方談為何"甲板上沒(méi)有艦載機(jī)"

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 色爱无码综合网| 免费国产好深啊好涨好硬视频| 久久人人妻人人爽人人爽| 色色狠狠| 精品国产AV二区| 女人18毛片水真多| 精品国产乱码久久久久APP下载| 亚洲video| 伊人五月久久1区| 精品国产免费第一区二区三区| 无码人妻h动漫| 美女胸18下看禁止免费视频| 国产精品69毛片高清亚洲 | 任我爽精品视频在线播放| 91在线影院| 亚洲无码天堂| 国产蜜臀av在线一区尤物| 91精品乱码一区二区三区| 国产精品A片| 人妻在线中文| 大屁股肥熟女流白浆| 久久精品亚洲| 久久久久久久av| 民丰县| 国产男女猛烈无遮挡免费视频网站| 色94色欧美sute亚洲线路二| 精品无码老熟妇magnet| 日韩AV导航| 四川少妇被弄到高潮| 男人的天堂无码动漫av| 一区二区淫网| 驻马店市| 国产亚洲视频在线播放香蕉| 青青av| 少妇无码视频| 亚洲色最新高清AV网站| 老司机久久影院| 牲欲强的熟妇农村老妇女视频| 国产特级毛片aaaaaa高清| 亚洲av片在线免费观看| 黔西|