<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛,OpenAI迎10周年,發GPT-5.2,重點是和白領搶工作

      0
      分享至


      智東西
      作者|江宇
      編輯|漠影

      智東西12月12日報道,今日凌晨,正值OpenAI十周年生日,OpenAI正式推出其迄今最強模型GPT-5.2,并同步上線ChatGPT與API體系。

      本次更新包含GPT-5.2 Instant、Thinking與Pro三個版本,將從今日起陸續向Plus、Pro、Business與Enterprise等付費方案用戶開放,Free與Go用戶預計將于明日獲得訪問權限。同時,GPT-5.2也已納入API與Codex中供開發者調用。


      ▲圖源:X平臺

      現有的GPT-5.1將在ChatGPT中繼續作為過渡版本向付費用戶提供三個月,之后將正式下線。OpenAI官方稱,GPT-5.2屬于其持續改進模型系列的一部分,后續仍將圍繞過度拒絕、響應延遲等已知問題進行迭代優化。

      在API端,GPT-5.2 Thinking對應gpt-5.2,Instant對應gpt-5.2-chat-latest,Pro對應gpt-5.2-pro,開發者可直接調用。


      ▲圖源:OpenAI官方博客

      在價格方面,GPT-5.2的調用價格較上一代上調,輸入端1.75美元/百萬tokens(約合人民幣12.35元/百萬tokens)、輸出端14美元/百萬tokens(約合人民幣98.81元/百萬tokens)。GPT-5.2 Pro的定價為21美元與168美元/百萬tokens(約合人民幣148元與1185元/百萬tokens),并首次支持第五檔推理強度xhigh。


      ▲圖源:OpenAI官方博客

      OpenAI聯合創始人兼CEO Sam Altman在社交平臺X上公布了GPT-5.2在多項前沿基準上的成績:SWE-Bench Pro達到55.6%,ARC-AGI-2為52.9%,Frontier Math為40.3%。


      ▲圖源:X平臺

      這些基準主要用于衡量模型在復雜代碼修復、通用推理與高難度數學任務中的表現,GPT-5.2在高階任務上的穩定性進一步提升。

      根據OpenAI官方博客,GPT-5.2在涵蓋44個職業的明確知識工作任務中,表現均優于行業專業人士。相比GPT-5.1 Thinking,GPT-5.2 Thinking在應對知識型任務、編程、科學問題、數學、抽象推理的多項能力均大幅提升,尤其是在頂尖數學競賽AIME 2025拿到滿分成績,在OpenAI專業工作基準測試GDPval中戰勝或打平70.9%的人類專家。


      ▲圖源:OpenAI官方博客

      OpenAI團隊成員Yann Dubois也在社交平臺X平臺上發帖稱,GPT-5.2 Thinking的設計重點放在“經濟價值較高的任務”(如編碼、表格與演示文檔)。


      ▲圖源:X平臺

      此外,在SWE-Bench Pro、GPQA Diamond等8項基準測試中,GPT-5.2 Thinking的分數均超過谷歌Gemini 3 Pro和Anthropic Claude Opus 4.5。


      ▲圖源:OpenAI

      值得一提的是,GPT-5.2在處理多模態任務方面的能力明顯提升,大有追上Gemini的架勢,“頂流”AI編程助手Cursor第一時間宣布上新GPT-5.2。

      與此同時,微軟董事長兼CEO Satya Nadella宣布,GPT-5.2將全面進入Microsoft 365 Copilot、GitHub Copilot與Foundry等產品體系。


      ▲圖源:X平臺

      在GPT-5.2的發布會上,OpenAI應用業務負責人Fidji Simo也確認,外界關注已久的ChatGPT“成人模式(adult mode)”預計將在2026年第一季度上線。Fidji Simo稱,在推出該模式前,OpenAI希望確保年齡預測模型足夠成熟,能夠準確識別未成年用戶,同時避免誤判成年人。

      目前,該年齡預測模型已在部分國家進行早期測試,主要用于自動應用不同的內容限制與安全策略。

      一、專業任務能力躍升,首次達到“專家級”評分

      根據OpenAI官方披露,GPT-5.2 Thinking在覆蓋44類職業任務的GDPval評測中,首次達到“專家級”表現——在70.9%的對比中戰勝或持平行業專業人士。GPT-5.2 Pro進一步提升至74.1%。在僅統計“明確勝出”的任務中,GPT-5.2 Thinking為49.8%,Pro則達到60%。

      這一評測覆蓋銷售演示、預算模型、運營排班、制造流程圖等多類真實業務成果。GPT-5.2在這些任務的生成速度約為人工專家的11倍,成本為其1%以下。

      在投研類任務中,GPT-5.2 Thinking在內部評測的投行三表模型與杠桿收購模型等場景中的平均得分為68.4%,較GPT-5.1 Thinking的59.1%有明確提升,GPT-5.2 Pro得分進一步增長至71.7%。


      ▲圖源:OpenAI官方博客


      ▲GPT-5.1 Thinking與GPT-5.2 Thinking效果對比

      二、代碼、工具調用與長鏈路任務全面升級

      在代碼能力方面,GPT-5.2 Thinking在更嚴格的SWE-bench Pro(跨四種語言、強調真實工程難度)中取得55.6%,在SWE-bench Verified中更是達到80%,均顯著領先GPT-5.1的50.8%與76.3%。在SWE-Lancer IC Diamond任務中,GPT-5.2 Thinking取得74.6%(GPT-5.1為69.7%)。


      ▲圖源:OpenAI官方博客

      與此同時,GPT-5.2出現在AI基準平臺Imarena.ai(Arena)排行榜中,并在WebDev測試中取得1486分,位列第二,僅落后榜首3分,領先Claude-opus-4-5與Gemini-3-pro等主流模型。另一個版本GPT-5.2則以1399分排在第六。

      根據Arena說明,GPT-5.2此前在內部以“robin”和“robin-high”為代號進行測試,其分數與GPT-5-medium僅相差1分,目前仍為初步結果,未來有望隨著測試量積累而進一步穩定。


      從評測維度來看,Arena主要衡量模型在可部署Web應用情境下的端到端編碼能力,GPT-5.2已反映出其在復雜任務鏈條上的實用性。

      在事實準確性方面,GPT-5.2 Thinking在基于ChatGPT查詢的無錯誤回答率(開啟搜索模式下)達到93.9%,較GPT-5.1的91.2%有所改善,在無搜索情況下也從87.3%提升至88%。


      ▲圖源:OpenAI官方博客

      另一個關鍵變化來自工具調用與長鏈路任務的可靠性提升。

      GPT-5.2 Thinking在Tau-2 Bench Telecom中達到98.7%的最高得分,在零推理模式下也大幅領先上一代,在更高噪聲的Retail場景中準確率從77.9%提升至82%。在更通用的工具鏈評估BrowseComp中,GPT-5.2 Thinking達到65.8%,Pro版本達到77.9%,亦高于GPT-5.1的50.8%。


      ▲圖源:OpenAI官方博客

      OpenAI提到,GPT-5.2 Thinking和Pro均支持第五檔推理強度xhigh,適用于長流程、多步驟、高精度的專業任務場景。

      三、在長上下文與視覺理解,GPT-5.2全面增強

      在長上下文能力上,GPT-5.2 Thinking在OpenAI MRCRv2中全面領先上一代,在8 needles測試中從4k到256k的范圍內均保持遠高于GPT-5.1的表現,其中在4k–8k長度下達98.2%,在128k–256k長度下仍保持77.0%,而GPT-5.1同期為29.6%–47.8%區間。

      在其他長文場景中,BrowseComp Long Context(128k/256k)中,GPT-5.2 Thinking分別達到92.0%與89.8%。GraphWalks任務中,GPT-5.2 Thinking在bfs與parents子集分別達到94.0%與89.0%,相比GPT-5.1的76.8%與71.5%顯著提升。


      ▲圖源:OpenAI官方博客

      在視覺理解上,GPT-5.2 Thinking在CharXiv科學圖表推理任務中無工具模式下為82.1%,開啟Python工具后進一步提升至88.7%。在ScreenSpot-Pro界面理解中,GPT-5.2 Thinking取得86.3%,遠高于GPT-5.1的64.2%。在視頻類、多模態綜合難度更高的Video MMMU中,也從82.9%提升至85.9%。

      在視覺能力上,GPT-5.2在ScreenSpot-Pro(界面理解)中達到86.3%的準確率,相比GPT-5.1有明顯提升。在CharXiv科學圖表推理任務中,也實現了準確率的大幅增長。這使其在處理科研圖表、運營儀表盤、產品界面截圖等專業視覺輸入時更加可靠。


      ▲圖源:OpenAI官方博客

      四、微軟全家桶同步升級,GPT-5.2成為新一代“生產力模型”

      隨著GPT-5.2發布,微軟董事長兼CEO Satya Nadella也在社交平臺X平臺上宣布,GPT-5.2將全面進入Microsoft 365 Copilot、GitHub Copilot與Foundry等產品體系,并作為新的“默認推理模型”服務更多工作流場景。

      在Microsoft 365 Copilot中,用戶已經可以通過模型選擇器啟用GPT-5.2,用于會議記錄分析、文檔推理、市場研究與戰略規劃等高復雜度任務。Nadella稱,將模型與用戶工作數據結合后,GPT-5.2能夠更充分發揮推理優勢。

      在GitHub Copilot中,GPT-5.2適用于長上下文推理與復雜代碼庫審查,重點覆蓋跨文件關系分析、依賴追蹤與重構建議等工程類使用場景。

      此外,GPT-5.2還同步進入Microsoft Foundry與Copilot Studio,開發者可在構建自動化流程、企業內部Agent或自主開發時直接調用GPT-5.2模型。面向消費者端的Copilot也將隨后啟動分階段更新,逐步替換當前版本。


      ▲圖源:X平臺

      從微軟生態的覆蓋面來看,GPT-5.2已被定位為“默認生產力模型”,在不同產品線之間以自動模型選擇的方式服務更廣泛的開發、寫作與分析任務。

      此外,頂流AI編程助手Cursor也已第一時間火速上線GPT-5.2,并同步沿用OpenAI官方API價格。


      ▲圖源:Cursor

      結語:GPT-5.2的能力邊界正向“穩定、實用”收攏

      從多項公開基準測試到Arena針對Web應用端到端能力的評測結果,GPT-5.2展現出的整體能力向穩定可用和任務完成度方向收攏。

      隨著Instant、Thinking與Pro組成的多檔能力體系的開放,GPT-5.2在不同工作流中被切分為更清晰的使用場景。而在微軟生態中的全面接入,也進一步強化了這一變化的方向。無論是在M365 Copilot中承擔跨文檔推理,還是在GitHub Copilot中處理長上下文代碼鏈路,GPT-5.2都開始參與到更高頻、更具體的任務流程中。

      除了推出面向專業工作和智能體的前沿模型外,OpenAI還宣布已經與迪士尼達成授權協議,允許Sora 2用戶在生成并分享的圖片中使用迪士尼角色。迪士尼將向OpenAI投資10億美元(約合人民幣71億元),并擁有未來增持股份的選擇權。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      上映10小時,《阿凡達3》強勢奪冠,卡梅隆把《動物城2》打懵了

      上映10小時,《阿凡達3》強勢奪冠,卡梅隆把《動物城2》打懵了

      八卦南風
      2025-12-18 14:38:36
      韓國特工與泰軍合作,潛入電詐園抓獲殺害韓國女人質的中國籍綁匪

      韓國特工與泰軍合作,潛入電詐園抓獲殺害韓國女人質的中國籍綁匪

      環球熱點快評
      2025-12-18 11:43:15
      西藥見效快!中國三大運營商為美國解決詐騙電話,攔截率達99%

      西藥見效快!中國三大運營商為美國解決詐騙電話,攔截率達99%

      垛垛糖
      2025-12-18 12:16:13
      北京市住建委要求互聯網平臺及時下架唱衰樓市等違規信息

      北京市住建委要求互聯網平臺及時下架唱衰樓市等違規信息

      環球網資訊
      2025-12-18 09:36:13
      蘋果宣布:大幅降低日本“蘋果稅”,iPhone開放第三方應用商店和支付!專家:中國被區別對待,抽成比例高于美歐日韓

      蘋果宣布:大幅降低日本“蘋果稅”,iPhone開放第三方應用商店和支付!專家:中國被區別對待,抽成比例高于美歐日韓

      每日經濟新聞
      2025-12-18 22:26:26
      澤連斯基還是跪下了,此刻他最后悔的,恐怕就是當初沒聽中國的

      澤連斯基還是跪下了,此刻他最后悔的,恐怕就是當初沒聽中國的

      云舟史策
      2025-12-18 07:21:17
      王毅分別同柬埔寨、泰國外長通電話

      王毅分別同柬埔寨、泰國外長通電話

      新華社
      2025-12-18 19:30:04
      轟炸機抵近東京,美國拒表態,日本承認波茨坦公告,求中國一件事

      轟炸機抵近東京,美國拒表態,日本承認波茨坦公告,求中國一件事

      梁訊
      2025-12-18 10:38:01
      絲芭傳媒再發文:要求鞠婧祎方立刻停止侵權抹黑,將就其和關聯人涂某某等涉嫌嚴重經濟犯罪行為,向相關監管機構實名舉報

      絲芭傳媒再發文:要求鞠婧祎方立刻停止侵權抹黑,將就其和關聯人涂某某等涉嫌嚴重經濟犯罪行為,向相關監管機構實名舉報

      極目新聞
      2025-12-18 11:17:51
      第一批免簽去俄羅斯的消費者們,估計都傻眼了……

      第一批免簽去俄羅斯的消費者們,估計都傻眼了……

      翻開歷史和現實
      2025-12-18 12:42:20
      香港中環發生巨額劫案 4持刀男劫走10億日元

      香港中環發生巨額劫案 4持刀男劫走10億日元

      看看新聞Knews
      2025-12-18 14:16:03
      日德聯手“斷供”高鐵車輪,毀掉8000萬美元訂單,中國絕不慣著

      日德聯手“斷供”高鐵車輪,毀掉8000萬美元訂單,中國絕不慣著

      胖福的小木屋
      2025-12-17 23:17:10
      索尼將退出中國,3萬員工一夜失業,一代人的青春落幕

      索尼將退出中國,3萬員工一夜失業,一代人的青春落幕

      胡嚴亂語
      2025-12-18 14:25:25
      國家統計局原局長邱曉華:很多人按揭買的房子,房子的價格已經比首付還要低!它給人帶來的心理沖擊是很大的

      國家統計局原局長邱曉華:很多人按揭買的房子,房子的價格已經比首付還要低!它給人帶來的心理沖擊是很大的

      和訊網
      2025-12-18 17:46:52
      痛批賴清德集權如“登基”!黃國昌:民眾黨團將正式提案彈劾

      痛批賴清德集權如“登基”!黃國昌:民眾黨團將正式提案彈劾

      海峽導報社
      2025-12-18 17:28:02
      全國統一判:“爛尾樓”購房者可解除合同,不再支付按揭貸款,由開發商兜底!

      全國統一判:“爛尾樓”購房者可解除合同,不再支付按揭貸款,由開發商兜底!

      微法官
      2025-10-15 08:06:34
      稅務局回應大廳凳子被指形似刑具:大家反饋坐著很舒服,專門定做的,采購經過正規審批,價格比市場便宜

      稅務局回應大廳凳子被指形似刑具:大家反饋坐著很舒服,專門定做的,采購經過正規審批,價格比市場便宜

      觀威海
      2025-12-18 10:18:04
      韋瑟斯龐56+6+6本季最高!青島輕取同曦3連勝 郭昊文18+9失誤

      韋瑟斯龐56+6+6本季最高!青島輕取同曦3連勝 郭昊文18+9失誤

      醉臥浮生
      2025-12-18 21:24:48
      對臺110億軍售后,不到24小時,美國收中方通知,13萬噸訂單沒了

      對臺110億軍售后,不到24小時,美國收中方通知,13萬噸訂單沒了

      時時有聊
      2025-12-18 20:55:37
      小學生吃早餐視頻火了,116萬網友點贊:這就是有父母兜底的幸福

      小學生吃早餐視頻火了,116萬網友點贊:這就是有父母兜底的幸福

      妍妍教育日記
      2025-12-18 20:23:32
      2025-12-19 00:55:00
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      10936文章數 116929關注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創業大賽總決賽收官

      頭條要聞

      在野黨參議員問了句日本"存亡危機" 高市早苗瞬間冷臉

      頭條要聞

      在野黨參議員問了句日本"存亡危機" 高市早苗瞬間冷臉

      體育要聞

      紐約尼克斯,板正的球隊

      娛樂要聞

      絲芭放大招了!實名舉報鞠婧祎經濟犯罪

      財經要聞

      尹艷林:呼吁加快2.5億新市民落戶進程

      汽車要聞

      在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩"的證明

      態度原創

      數碼
      健康
      藝術
      家居
      房產

      數碼要聞

      小米18系列再次被確認:國產雙層OLED+矩陣模組,友商有壓力了!

      這些新療法,讓化療不再那么痛苦

      藝術要聞

      卡洛斯·杜蘭:不只是薩金特的老師!

      家居要聞

      高端私宅 理想隱居圣地

      房產要聞

      搶藏瘋潮!封關時代,海口頂奢王炸壓軸,傳世資產即刻登場!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 4hu亚洲人成人无码网www电影首页 | 夜夜添无码试看一区二区三区| 99国产欧美久久久精品蜜芽| 天天噜天天干| 亚洲av无码国产在丝袜线观看| 水蜜桃av导航| 日日躁狠狠躁| 99久久婷婷国产综合精品青草五月 | 无码精品a∨在线观看中文| 美女内射毛片在线看3d| 海口市| 国精产品乱码一区一区三区四区| 免费无码又爽又黄又刺激网站| 国产爆乳无码av在线播放| 东乡县| 夫妻自拍偷拍| 在线a人片免费观看| 亚洲色偷精品一区二区三区| 国产日韩一区二区三区在线观看| 天天躁日日摸久久久精品| av女人的天堂| 国产精品午夜福利在线观看| 午夜精品久久久久久毛片| 99久久久无码国产精品免费 | 国产精品无码成人午夜电影| 啪啪电影| 丰满熟女人妻一区二区三| 亚洲中文字幕一区二区| 国产伦精品一区二区三区妓女下载| 河西区| canopen草棚类别9791怎么查| 亚洲成a人片在线观看中| 好男人中文资源在线观看| 日本边添边摸边做边爱的网站| 小樱3368776,22905jm17| 久久国产劲爆∧v内射| 中文字幕亚洲在线观看| 开心色怡人综合网站| 18禁无遮挡免费视频网站| 久久久久香蕉国产线看观看伊| 人妻少妇精品无码|