<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      OpenAI紅色警報下的反擊:發布GPT-5.2迎戰Gemini 3

      0
      分享至

      當谷歌的 Gemini 在各大 AI 排行榜上風頭正勁時,OpenAI 終于打出了新的王牌。

      周四,這家 AI 巨頭發布了 GPT-5.2,稱其是迄今為止“最強大的模型”,專為開發者和職場人士打造。


      (來源:OpenAI)

      這場發布會的時機頗為微妙。

      一個月前,OpenAI CEO 山姆·奧特曼(Sam Altman)向內部發出“紅色警報”,承認 ChatGPT 面臨巨大競爭壓力,正在輸掉消費市場份額。今天的 GPT-5.2 正是 OpenAI 試圖奪回領導地位的關鍵一步。

      同時,今天也是 OpenAI 官宣成立十周年的日子。

      GPT-5.2 模型家族包括三個不同版本:Instant、Thinking 和 Pro。

      Instant 是速度優化版本,專門處理日常查詢,比如信息檢索、寫作和翻譯這類常規任務。

      Thinking 則擅長復雜的結構化工作,在編程、分析長文檔、數學計算和項目規劃方面表現突出。

      Pro 則是頂級版本,旨在為最棘手的問題提供最高精度和可靠性。它的運行速度顯著慢于其他版本,且成本極其高昂,專為那些準確性高于一切、成本退居其次的重要任務設計。

      測試數據表明,Pro 版本是唯一在 ARC-AGI-1 推理基準測試中突破 90% 大關,并在 AIME 2025 數學競賽中不使用工具就達到 100% 滿分的模型。

      在 ChatGPT 中,GPT-5.2 的三個版本已經上線,首先面向付費用戶開放。OpenAI 表示將在未來幾天逐步部署 GPT-5.2,以保持 ChatGPT 盡可能流暢和可靠。

      “我們設計 GPT-5.2 就是為了給人們創造更多經濟價值。”OpenAI 應用業務 CEO 菲吉·西莫(Fidji Simo)在發布會上表示。她強調,新模型在創建電子表格、制作演示文稿、編寫代碼、圖像識別、理解長文本、使用工具以及處理復雜多步驟項目方面都有顯著提升。


      (來源:OpenAI)

      據其介紹,ChatGPT 企業版的普通用戶表示“AI 每天為他們節省 40-60 分鐘”,而重度用戶每周節省時間“超過十小時”。GPT-5.2 的目標就是進一步擴大這種價值。

      OpenAI 表示,GPT-5.2 在多項行業基準測試中創下新紀錄。


      圖 | 多項基準測試成績(來源:OpenAI)

      在涵蓋 40 多種職業專業知識的 GDPval 測試中,GPT-5.2 Thinking 的表現達到了專家級水平。根據專業評審的判斷,在 70.9% 的情況下,GPT-5.2 Thinking 擊敗或打平了頂級行業專業人士。這些任務包括制作演示文稿、電子表格和其他各類工作成果。

      更重要的是,GPT-5.2 完成這些任務的速度是專業人士的 11 倍以上,成本卻不到 1%,不過 OpenAI 并未公布模型 VS 人類的成本是如何計算的。


      (來源:OpenAI)

      在軟件工程領域,GPT-5.2 Thinking 在 SWE-Bench Pro 測試中達到了 55.6% 的新高分。這個成績也是超過了 Claude 4.5 Sonnet 和 Gemini 3 Pro。在更基礎的 SWE-bench Verified 測試中,GPT-5.2 的得分更是達到了 80%。


      (來源:資料圖)

      OpenAI 研究主管艾丹·克拉克(Aidan Clark)解釋說,更強的數學能力不僅僅是解方程那么簡單。數學推理能力是衡量模型能否遵循多步驟邏輯、保持數字長期一致性、避免可能隨時間累積的細微錯誤的代理指標。

      在科學問題方面,GPT-5.2 Pro 在 GPQA Diamond 測試中取得了 93.2% 成績。GPT-5.2 Thinking 也有 92.4% 的高分。雙雙打破了 Gemini 3 Pro 保持的紀錄。




      圖 | GPQA Diamond 榜單(來源:OpenAI)

      克拉克在發布會上分享了一個案例:團隊讓一位資深免疫學研究員使用 GPT-5.2 Pro,當研究員要求模型生成關于免疫系統最重要的未解問題時,模型產生了“更敏銳的問題和更有力的解釋”,用于說明這些問題為何重要。該研究員認為其表現超過了“所有其他前沿模型”。

      在可靠性方面,GPT-5.2 也取得了重要進展。OpenAI 后訓練負責人馬克斯·施瓦策(Max Schwarzer)指出,在衡量對事實性問題回答的基準測試中,GPT-5.2 Thinking 的幻覺出現率比 GPT-5.1 降低了 38%。


      (來源:OpenAI)

      長文本理解方面,GPT-5.2 Thinking 同樣創下了新紀錄。OpenAI 采用 MRCRv2 評估來衡量模型整合分散在長文檔中信息的能力。

      處理需要跨越數十萬 token 相關信息的真實任務時,GPT-5.2 Thinking 的準確性遠超 GPT-5.1 Thinking。它是第一個在四針 MRCRv2 測試中(最多 256k token)實現接近 100% 準確率的模型。


      (來源:OpenAI)

      這意味著專業人士可以更放心地使用 GPT-5.2 處理長文檔,如報告、合同、研究論文、記錄和多文件項目,同時在數十萬 token 范圍內保持連貫性和準確性。

      在視覺能力方面,GPT-5.2 Thinking 在圖表推理和軟件界面理解方面的準確率提升近 50%。這意味著模型可以更準確地解讀儀表板、產品截圖、技術圖表和可視化報告,支持更加依賴視覺信息的工作流。

      相比之前的模型,GPT-5.2 Thinking 對圖像中元素位置的把握更強。例如,在識別主板圖像中的組件并返回大致邊界框的任務中,即使在低質量圖像上,GPT-5.2 也能識別主要區域并放置與每個組件真實位置有時匹配的框,而 GPT-5.1 只能標記少數部分,對空間排列的理解要弱得多。


      (來源:OpenAI)

      值得一提的是,OpenAI 的新圖像生成工具仍然缺位。據報道,奧特曼曾在內部紅色警報備忘錄中表示,圖像生成將是未來的重點,特別是在谷歌的新版 Nano Banana 發布之后。

      據報道,OpenAI 計劃在明年一月發布另一款新模型,具有更好的圖像效果、更快的速度和更好的個性,但尚未得到官方確認。

      最后在發布會上,OpenAI 承認在某些方面還有改進空間。比如在 ChatGPT 中,公司正在努力解決過度拒絕等已知問題,同時繼續提高回復的可靠性。此外,OpenAI 據傳正在考慮開放模型成人內容限制。

      對于 OpenAI 來說,GPT-5.2 能否幫助它重新奪回失去的領地,還需要時間來證明。

      參考資料:

      https://openai.com/index/introducing-gpt-5-2/

      https://www.theverge.com/ai-artificial-intelligence/842529/openai-gpt-5-2-new-model-chatgpt

      https://techcrunch.com/2025/12/11/openai-fires-back-at-google-with-gpt-5-2-after-code-red-memo/

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      泰軍炸掉詐騙園區、器官移植中心,洪森為何氣急敗壞?

      泰軍炸掉詐騙園區、器官移植中心,洪森為何氣急敗壞?

      胡嚴亂語
      2025-12-16 20:33:51
      海南封關首日三亞大東海擠滿俄羅斯游客,海灘廣播以中俄雙語循環播放

      海南封關首日三亞大東海擠滿俄羅斯游客,海灘廣播以中俄雙語循環播放

      極目新聞
      2025-12-18 10:13:32
      東亞錦標賽大冷門!43歲日本籍主帥神了:率中國香港2-0韓國+領跑

      東亞錦標賽大冷門!43歲日本籍主帥神了:率中國香港2-0韓國+領跑

      側身凌空斬
      2025-12-18 11:42:17
      撿到寶了!泰國上將:中國沒要求歸還導彈,將反打柬埔寨59D坦克

      撿到寶了!泰國上將:中國沒要求歸還導彈,將反打柬埔寨59D坦克

      臨云史策
      2025-12-16 22:36:11
      赴日外國游客突破3900萬人次再創歷史新高 中國游客影響有限

      赴日外國游客突破3900萬人次再創歷史新高 中國游客影響有限

      顫抖的熊貓
      2025-12-17 22:12:26
      中紀委打下今年第61虎!王文華被查,任職地原市長受賄1.55億被判無期

      中紀委打下今年第61虎!王文華被查,任職地原市長受賄1.55億被判無期

      新浪財經
      2025-12-18 12:49:30
      狄龍再懟詹姆斯:上一場就該最后讓他投三分,那球肯定三不沾

      狄龍再懟詹姆斯:上一場就該最后讓他投三分,那球肯定三不沾

      懂球帝
      2025-12-18 08:06:12
      好評中國|歲末回望,中國經濟底色厚亮色足暖色滿

      好評中國|歲末回望,中國經濟底色厚亮色足暖色滿

      國際在線
      2025-12-18 14:06:38
      重慶中央公園的“化石”不能挖了!現場已拉起警戒線

      重慶中央公園的“化石”不能挖了!現場已拉起警戒線

      半島晨報
      2025-12-17 20:00:03
      6冠王!巴黎點球戰3-2奪洲際杯冠軍 世界足球先生失點 門神4撲點

      6冠王!巴黎點球戰3-2奪洲際杯冠軍 世界足球先生失點 門神4撲點

      我愛英超
      2025-12-18 04:11:59
      河北民間歌手“喜子”去世!44歲未婚,疑熬夜致心梗,鄉親曝細節

      河北民間歌手“喜子”去世!44歲未婚,疑熬夜致心梗,鄉親曝細節

      裕豐娛間說
      2025-12-18 13:06:44
      崔麗麗的戰爭:穿著“血衣”出庭后,被性侵的她又遭遇網暴|2025未完待續

      崔麗麗的戰爭:穿著“血衣”出庭后,被性侵的她又遭遇網暴|2025未完待續

      紅星新聞
      2025-12-18 08:37:15
      韓國特工與泰軍合作,潛入電詐園抓獲殺害韓國女人質的中國籍綁匪

      韓國特工與泰軍合作,潛入電詐園抓獲殺害韓國女人質的中國籍綁匪

      環球熱點快評
      2025-12-18 11:43:15
      海南封關首日實探三亞免稅城:免稅價疊加消費券,蘋果手機最高可減1000元

      海南封關首日實探三亞免稅城:免稅價疊加消費券,蘋果手機最高可減1000元

      極目新聞
      2025-12-18 12:08:09
      稅務局回應大廳凳子被指形似刑具:大家反饋坐著很舒服,專門定做的,采購經過正規審批,價格比市場便宜

      稅務局回應大廳凳子被指形似刑具:大家反饋坐著很舒服,專門定做的,采購經過正規審批,價格比市場便宜

      觀威海
      2025-12-18 10:18:04
      郭昊羽已任廣東省住建廳黨組書記

      郭昊羽已任廣東省住建廳黨組書記

      南方都市報
      2025-12-18 13:47:22
      山東省煙臺萊州市發現亞洲最大海底巨型金礦

      山東省煙臺萊州市發現亞洲最大海底巨型金礦

      財聯社
      2025-12-18 10:32:05
      外籍男子國際航班上辱罵兩名中國女乘客,哈爾濱女博士用英語反擊,當事人:他酒后鬧事,被帶離后全場鼓掌

      外籍男子國際航班上辱罵兩名中國女乘客,哈爾濱女博士用英語反擊,當事人:他酒后鬧事,被帶離后全場鼓掌

      極目新聞
      2025-12-18 13:41:36
      燒光15億!曾叫板迪士尼的樂園,開業4年倒閉,今竟成網紅打卡地

      燒光15億!曾叫板迪士尼的樂園,開業4年倒閉,今竟成網紅打卡地

      品牌觀察官
      2025-12-17 20:24:55
      南京導航集體失靈,多種導航服務出現大偏差!什么原因導致的?

      南京導航集體失靈,多種導航服務出現大偏差!什么原因導致的?

      科普大世界
      2025-12-18 08:56:27
      2025-12-18 14:19:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16011文章數 514408關注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創業大賽

      頭條要聞

      浙大博士花40萬買車庫爆火 員工沒工資天天加班到凌晨

      頭條要聞

      浙大博士花40萬買車庫爆火 員工沒工資天天加班到凌晨

      體育要聞

      巴黎首奪世界級冠軍 加冕6冠王比肩巴薩拜仁

      娛樂要聞

      內娛解約大戰:鞠婧祎和絲芭,誰是狼人

      財經要聞

      重大改革,身關14億人的政策徹底變了!

      汽車要聞

      開箱日產大沙發 精致辦公or躺平追劇 哪個更適配?

      態度原創

      旅游
      房產
      本地
      公開課
      軍事航空

      旅游要聞

      西媒:尋訪秘魯“北方的馬丘比丘”

      房產要聞

      太強了!封關時刻,兩天砸下50億!央企綠發,重倉三亞!

      本地新聞

      云游安徽|決戰烽火照古今,千秋一脈看宿州

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      最新現場:山東艦完成年度最后一次海上訓練

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 无码人妻精品中文字幕| 国产97视频| 90后极品粉嫩小泬20p| 人人摸人人搞人人透| 苍井空浴缸大战猛男120分钟| 麻江县| jizz亚洲| 97久久精品人人做人人爽| 富婆如狼似虎找黑人老外| 亚洲色无码专区一区| 国产亚洲精品??码| 色天使av| 人妻?无码?中出| 久久99精品国产99久久6尤物| 日韩AV无码电影| 欧美乱大交xxxxx疯狂俱乐部| 日本va欧美va精品发布| 中文字幕av在线| 国产播放91色在线观看| 91超碰在线精品| 无码人妻精品中文字幕| 国产偷人爽久久久久久老妇app| www.jizz国产| caoporn国产| 啪啪电影| 国产精品乱码一区二区三区| 人妻丰满熟妇无码区免费| 1000部拍拍拍18勿入免费视频下载| 亚洲色欲久久久综合网东京热| 东台市| 2025亚洲无码视频| 国产v专区| jizz18| 老师破女学生处特级毛ooo片| 另类 专区 欧美 制服丝袜| 亚洲熟妇av日韩熟妇在线| 色欲国产麻豆一精品一av一免费| 亚洲精品不卡无码福利在线观看| 日本午夜视频| 奉新县| 亚洲AV一卡二卡|