<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.2降智遭全網差評!奧特曼慌了

      0
      分享至


      新智元報道

      編輯:桃子 KingHZ

      【新智元導讀】年終AI大戲,OpenAI敗給了谷歌?GPT-5.2上線48小時,全網吐槽一大片。第三方數據實證,Gemini 3 Pro才是真正的王者。

      OpenAI打出了GPT-5.2這張「年度王牌」,卻沒有打贏谷歌...


      Epoch AI最新報告,GPT-5.2的能力指數(ECI)得分152,僅次于Gemini 3 Pro。


      在多項基準測試中,GPT-5.2的實力并沒有「全線霸榜」。

      在由陶哲軒聯手百位數學家出的考題——FrontierMath中,GPT-5.2僅在T1-3級中霸榜,T4還是Gemini 3的高地。

      另外,在國際象棋Chess Puzzles中,GPT-5.2拿下了第一的成績。

      唯一例外的是,在SimpleQA Verified上,GPT-5.2都不及GPT-5.1,意味著迭代后的可信度更差了。


      不僅如此,多個第三方基準評測顯示,GPT-5.2遠不及預期,沒有打敗Gemini 3。



      左右滑動查看

      包括OCR-Arena、simple-bench、Live-Bench上,GPT-5.2甚至都排在了Claude Opus 4.5之后。




      左右滑動查看

      發布僅兩天,GPT-5.2水花不大,反而圈子里開發者吐槽的不少。

      為了打贏這場硬仗,OpenAI拉響「紅色警報」,把改進ChatGPT事項提到了優先級。

      更極端的是,內部直接停掉了AGI的研發,Sora也暫停了八周,顯然擺出了破釜沉舟的姿態。


      可是呢,在業界來看,OpenAI至今仍未擺脫被動的局面。

      GPT-5重度用戶站出來發聲,「GPT-5.2距離成為一塊石頭也不遠了」。


      年終之戰,OpenAI敗了?

      三年前,谷歌因錯失先機,被OpenAI ChatGPT搶盡了風頭。

      昨天,谷歌創始人謝爾蓋·布林重返斯坦福演講,現場公開承認曾經的「最大失誤」:

      我們搞砸了——太怕AI說錯話,結果輸掉一個時代。

      如今,憑借Gemini 3 Pro+Nano Banana Pro,谷歌已重回AI浪潮之巔。

      風水輪流轉。這一次,輪到了OpenAI,卻在2025年這場關鍵戰役中自亂陣腳。


      上線首日,奧特曼激動宣稱,API調用量就超過了萬億token,且增長速度極快

      此前Information爆料,GPT-5.2,代號大蒜(Garlic),原計劃在明年初亮相。

      整個硅谷,曾透露了一種風聲——OpenAI預訓練終結了,甚至GPT-5.1可能基于4o后訓練而來,由此提升不大。

      確實如此,在預訓練上,OpenAI遇到了Scaling瓶頸。


      預訓練Scaling,或許不大

      在GPT-5.2(大蒜)研發上,原爆料稱,OpenAI解決了預訓練環節遇到的一些關鍵問題——

      改進之前「最好的」且「體量大得多」的預訓練模型。

      在內部,OpenAI整合了在開發「Shallotpeat」期間修復的Bug,積累了許多預訓練的經驗。

      正如Information所言,最關鍵的突破發生在「預訓練階段」。


      但以上的一切信息,都是新聞報道。OpenAI究竟在預訓練上,是否實現了重大突破,難以得知。

      但從官方全線擊敗Gemini 3基準上可以猜測,GPT-5.2在預訓練方面取得了一定的改進。


      但是從第三方評測和網友反饋中,GPT-5.2在底層技術迭代上,沒有實現突破式的進展。




      Epoch AI另一項評估中,頂尖AI大模型在長程任務的性能,Gemini 3依舊是最強的——

      Gemini 3 Pro:4.9小時

      GPT-5.2:3.5小時

      Opus 4.5:2.6小時


      正如工程師Dan Mac所言,Gemini 3 Pro之所以擁有更深入的智能,是因為谷歌預訓練最強。

      而GPT-5.2擁有最好的專用智能,是OpenAI在后訓練上優化的結果。


      明年初,還有更大的

      紐約時報最新爆料稱,接下來幾周,OpenAI將繼續把重點放在ChatGPT優化上。

      他們正在籌備明年初的一次更大規模發布。


      在內部,OpenAI的2B和2C方向的「雙線作戰」模式并行。

      OpenAI也在推進其他項目,包括廣告和電商相關嘗試。

      盡管被吐槽,他們仍在探索「更克制」的方式,比如通過ChatGPT聊天完成購物,并從交易中抽成。

      在企業市場方面,OpenAI正將支撐ChatGPT的同一套AI技術引入企業軟件領域。


      數據顯示,每周使用ChatGPT的用戶超過8億人,市場份額約為76%。

      一位AI大佬說,「消費級AI幾乎就等同于OpenAI,如果失去了這一點,這家公司就不會有現在這樣的價值」。

      然而,在過去12個月里,全世界多家AI初創已開發出能夠匹敵,甚至在某些方面超越OpenAI領先模型的技術。

      谷歌Gemini 3 Pro的出世,對OpenAI業務來說著實是一次不小的打擊。


      Gemini 3力壓GPT-5.2,

      OpenAI只是虛晃一槍?

      就從網友實測角度來說,GPT-5.2還有很大的改進空間。

      有網友忍無可忍,直言OpenAI完全沒腦子:

      GPT-5.2語氣冰冷,堪比北極,完全無視用戶體驗,「一味地不斷倒退,把原本正常、自然的語言越改越離譜,最后變成一堆辱罵和說教,然后還把這當成某種勝利來兜售?!?br/>

      OpenAI活該被Gemini 3嚇得夠嗆。


      比如,在視覺推理上,Gemini 3 Pro完全碾壓GPT-5.2。


      3D模型生成上,GPT-5.2速度更慢、成本更高,總體表現不如Gemini 3。


      越界小說生成上,GPT-5.2墊底,不如Gemini 3 Pro、Claude 4.5 Opus、Grok 4:


      越界小說是一種文學類型,以渴望沖破社會桎梏與基本規范的角色為核心。

      這類作品通常涉及一系列禁忌主題、黑暗題材與極端議題。

      前端代碼生成上,Gemini 3大幅領先,GPT-5.2仍望塵莫及。


      在相同提示下,在健身儀表盤首頁設計上,53萬多人討論了Gemini 3 、GPT-5.2和Claude Opus 4.5的設計,


      提示詞:健身儀表盤首頁。頂部為每周活動概覽(緊湊型),今日消耗卡路里及環形進度條(緊湊卡片),卡路里卡片下方為連續鍛煉計數器,底部為周度鍛煉柱狀圖。移動端應用,單屏顯示。視覺風格:淺色模式,柔和的乳白色背景,圓角卡片帶有細微陰影,珊瑚色作為主要強調色,電子藍用于圖表和高亮部分。簡潔的無襯線字體排版,現代卡片式布局。情緒:激勵人心且充滿活力。清新、純凈且平易近人。現代健康美學,令人感到鼓舞和振奮。

      GPT 5.2幾乎次次墊底:




      開發者Mattia用AI搜索模型Perplexity查看了全部評論,Gemini 3是最后的贏家!


      如果以上只是個例,那下列的數據不會撒謊:GPT-5.2不及Gemini 3 Pro。

      GPT-5.2慘遭滑鐵盧

      在博彩網站Ploymarket上,大部分網友認為谷歌在今年年底擁有最好的AI模型。


      在網友Lisan al Gaib的小型手動性能對比基準Dubesors上,Gemini 3 Pro排名第一,而GPT-5.2排到了16名。


      致力于推動AI安全研究和提升公共討論關注度的CAIS(Center for AI Safety,人工智能安全中心),發布了最新的CAIS AI Dashboard,結果還是Gemini 3 Pro在文本和視覺能力指數上勝出,就在風險指數上落后GPT-5.2。




      左右滑動查看

      在文本能力指數測試中,Gemini 3 Pro只在ARC-AGI-2中落后,GPT-5.2幾乎全線潰?。?/p>


      在視覺能力指數測試中,Gemini 3 Pro再次幾乎全勝,比GPT-5.2平均得分高出了4.5分!


      在風險指數測試中,GPT-5.2領先Gemini 3 Pro,但落后于Claude Opus 4.5和Claude Sonnet 4.5.


      在評估語言模型在終端環境中驅動自主智能體能力的測試平臺Terminus上,Gemini 3.0 Pro和GPT-5.2幾乎不分上下,但Gemini 3.0 Pro與GPT-5.2的高推理模式相比,仍平均多了0.2%。


      此外,網友也驗證其他基準測試,比如SWE-Bench、IUMB:



      總之,GPT-5.2疑似翻車,在多個重要的基準測試中似乎落后于Gemini 3:


      奧特曼圣誕驚喜

      GPT-5.2發布當天,奧特曼還預告了,下一周還有「圣誕禮物」。


      至于新品,可能就是下一代GPT Image v2模型了。

      幾天前,兩款神秘AI圖像模型「栗子」和「榛子」在LM Arena平臺上展開測試。



      但是,開發者實測后表示,目測OpenAI圖像模型不太樂觀。


      在圖像生成/編輯方面,GPT圖像模型遠落后于Gemini 3加持的Nano Banana Pro。

      而且輸出的結果,存在一系列的問題——

      黃色色調、邏輯性差、一致性弱、圖像質量較低、世界知識不足等問題。

      據稱,這款模型的基底,可能還是GPT-4o。





      左右滑動查看

      2025年終局之戰,真的已經塵埃落定了嗎?


      參考資料:

      https://www.nytimes.com/2025/12/11/technology/openai-google-ai-technology-gap.html

      https://dashboard.safe.ai/

      秒追ASI

      ?點贊、轉發、在看一鍵三連?

      點亮星標,鎖定新智元極速推送!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      49天主場全敗!卻將功臣掃地出門,你們臉都不要了,詹姆斯要背鍋

      49天主場全??!卻將功臣掃地出門,你們臉都不要了,詹姆斯要背鍋

      老侃侃球
      2025-12-18 03:30:03
      北京94-81遼寧!賽后看看各大媒體人怎么說,楊鳴或被追罰

      北京94-81遼寧!賽后看看各大媒體人怎么說,楊鳴或被追罰

      天光破云來
      2025-12-18 00:28:49
      綠營選戰鳴槍,國民黨13人被捕,島內亂作一團,鄭麗文大發雷霆

      綠營選戰鳴槍,國民黨13人被捕,島內亂作一團,鄭麗文大發雷霆

      聞識
      2025-12-17 18:57:11
      醫生發現:天冷堅持戴口罩的人,用不了多久,身體或會有5大變化

      醫生發現:天冷堅持戴口罩的人,用不了多久,身體或會有5大變化

      霹靂炮
      2025-12-04 22:54:47
      教育部發文減負,中小學考試“大瘦身”!孩子終于能喘口氣了!

      教育部發文減負,中小學考試“大瘦身”!孩子終于能喘口氣了!

      教師吧
      2025-12-17 14:47:40
      全球首款,成功試飛!

      全球首款,成功試飛!

      極目新聞
      2025-12-16 21:27:34
      東航MU5735飛機失事三周年,民用航空局說,事故原因決定不予公布

      東航MU5735飛機失事三周年,民用航空局說,事故原因決定不予公布

      干史人
      2025-12-17 19:00:05
      南京導航集體失靈?波及外賣、共享單車、網約車等服務

      南京導航集體失靈?波及外賣、共享單車、網約車等服務

      揚子晚報
      2025-12-17 22:41:04
      男子直播間花十幾萬“賭石”:付款前都說是頂級貨,切開后全是邊角料

      男子直播間花十幾萬“賭石”:付款前都說是頂級貨,切開后全是邊角料

      封面新聞
      2025-12-17 17:13:30
      “10戶中國家庭,7戶用公牛”遭同行吐槽:“大字吹牛,小字免責”!公牛集團:廣告語沒毛病,詆毀我們,起訴索賠420萬元

      “10戶中國家庭,7戶用公?!痹馔型虏郏骸按笞执蹬?,小字免責”!公牛集團:廣告語沒毛病,詆毀我們,起訴索賠420萬元

      每日經濟新聞
      2025-12-17 22:11:06
      醫學生:不是臨床死于2025,而是整個醫療系統開始崩盤了

      醫學生:不是臨床死于2025,而是整個醫療系統開始崩盤了

      書中自有顏如玉
      2025-12-17 14:12:07
      都別再有一天滅日本的幻想了,如果真的開戰,日本有著三重防線

      都別再有一天滅日本的幻想了,如果真的開戰,日本有著三重防線

      陳博世財經
      2025-12-17 11:09:53
      今天很多上海人在問,外面是什么味道?喉嚨好難受...浙江一些地方也是

      今天很多上海人在問,外面是什么味道?喉嚨好難受...浙江一些地方也是

      新民晚報
      2025-12-17 19:36:09
      他以一己之力改變了戰爭進程,一天之內炸沉2艘航母的牛人

      他以一己之力改變了戰爭進程,一天之內炸沉2艘航母的牛人

      知兵堂軍事
      2025-12-17 10:32:13
      這眼鏡美嬌娘造型雀實美,太頂了!

      這眼鏡美嬌娘造型雀實美,太頂了!

      貴圈真亂
      2025-12-17 13:44:12
      父親臨終塞他4億:把錢花光,當個敗家子!他奉父命養3個女友27年

      父親臨終塞他4億:把錢花光,當個敗家子!他奉父命養3個女友27年

      玥來玥好講故事
      2025-07-22 20:43:32
      中國游客消失后,日本人發現素質最差的是白人

      中國游客消失后,日本人發現素質最差的是白人

      無憂啟程
      2025-12-17 11:48:30
      國乒為什么要全力培養王楚欽?原來是馬龍給了劉國梁一個錯覺

      國乒為什么要全力培養王楚欽?原來是馬龍給了劉國梁一個錯覺

      民間平哥
      2025-12-17 20:08:39
      重大進展!我國自主研制,突破萬米大關!

      重大進展!我國自主研制,突破萬米大關!

      環球網資訊
      2025-12-17 09:17:03
      英相責令阿布解凍出售切爾西所得,否則將訴諸法律

      英相責令阿布解凍出售切爾西所得,否則將訴諸法律

      體壇周報
      2025-12-17 21:50:15
      2025-12-18 04:12:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14124文章數 66388關注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      萬斯公開與特朗普唱反調 承認美國人生活成本高漲

      頭條要聞

      萬斯公開與特朗普唱反調 承認美國人生活成本高漲

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝熱播劇姐弟戀真談了???

      財經要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      家居
      親子
      本地
      數碼
      公開課

      家居要聞

      溫馨獨棟 駝色與淺色碰撞

      親子要聞

      撒潑打滾的娃媽媽只有一早就制服了

      本地新聞

      云游安徽|踏過戰壕與石板,讀一部活的淮北史

      數碼要聞

      RGB-Mini LED迎來“跨年夜”,“光色同控”從電視走向桌面

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美大胆自慰| 2020国产欧洲精品网站| 一本一道久久综合狠狠躁牛牛影视| 91丝袜高潮流白浆潮喷在线观看| 色伊人综合| 国产乱色国产精品播放视频| 射死你天天日| 超碰成人网| 黄瓜视频91| 91资源总站| 国产伦精品一区二区三区妓女下载| 色婷婷久久久swag精品| 五月丁香六月综合缴清无码| 亚洲精品国产自在现线最新| 国产XXXX| 好吊妞人成视频在线观看27du| 国产jjizz女人多水| 日韩丝袜亚洲国产欧美一区| 正在播放夫妇露脸自拍| 久久天天久久| 亚洲一区二区三区av天堂| 伊人精品成人久久综合97| 熟女中文字幕| 亚洲国产精品无码av| 亚洲精品一区二区三区新线路| 草草浮力影院| 周至县| aaa少妇高潮大片免费看| 亚洲日韩精品欧美一区二区一| 欧洲成人在线观看| 亚洲wwww| 亚州精品人妻一二三区| 秋霞无码一区二区| 日日噜噜夜夜狠狠视频| 亚洲日韩第9页| 人妻中文网| 性按摩玩人妻hd中文字幕| 亚洲综合婷婷| 亚洲成人中文字幕| 黑人无码AV| 国产日产亚洲精品|