<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      實測GPT5.2打工人版的十種用法,我覺得Gemini 3 Pro要笑到肚子痛了

      0
      分享至

      新鮮出爐的GPT5.2又一次成“最強”了,

      這次居然沒有開發布會,浪費了我二十分鐘,

      現在應該已經全量上線到ChatGPT了,在OpenAI platform,Cursor,Codex,Perplexity上也能用到,這次API貴了40%,要好好看看值不值。

      我第一時間就跟Gemini 3 Pro,做了個編程對比,還盤點了10種GPT5.2的玩法。直接打印機起手,

      GPT5.2,

      Gemini 3 Pro,

      enmmm,有點不對,

      再看看OpenAI自己放出來的主case呢,

      一個電腦主板上面的元件和接口識別標記的case,結果連Gemini 2.5 Pro都沒打贏




      這批測試的超長提示語和代碼我都打包好了,公眾號后臺發我“gpt5.2”就行

      難道是我報告看劈叉了,再翻翻還是很頂,

      在AIME 2025(競賽數學)拿滿分,在 ARC-AGI-2(視覺推理)上拿到了 52.9%(翻了三倍,和 Gemini3 相當),在SWE-Bench Pro(軟件工程)、GPQA Diamond(科學問題)上也搶回第一了,

      256K文檔的四針測試正確率離譜到100%,知識截止日期也更新到25年8月份了。

      怪不得之前有人P圖GPT5.2全系第一。。。


      重點在GDPval和ARC-AGI-2,


      簡單來說,OpenAI想測試模型在真實世界對GDP的貢獻,可以說是賺錢能力,

      GDPval這數據集就是從銀行那調取的信息,選出對美國 GDP 貢獻最大的 9 個行業中選出的 44 種職業,


      1,320 個專業任務,每個任務都由平均有 14 年以上領域經驗的專業人士設計,任務本體包含了參考文件和背景信息,預期的輸出涵蓋文檔、ppt、圖表、電子表格和多媒體。


      https://arxiv.org/pdf/2510.04374

      測試的case長這樣,GPT 5.2 Thinking的平均得分比GPT 5.1 Thinking高9.3%,還是比較明顯能看到區別的。


      我用Gemini 3 Pro搓了一個賊復雜的Excel提示語,直接搭一個完整的模型。

      你要在 Excel 里從零構建一個可運營的商業預測模型,用于蜜雪冰城在12月內的 定價、銷量、收入、成本、費用、利潤、現金流 預測,并支持多情景對比與關鍵指標儀表盤。

      目標讀者是業務負責人和財務負責人,要求模型結構清晰、可審計、可擴展,所有計算使用 Excel 原生公式完成(不依賴宏)。

      (后面是每張表的詳細設定)

      GPT 5.2 Thinking跑啊跑,跑了半小時,

      把我所有的要求都實現了,

      以后出門在外自稱是Excel專家沒得問題了。

      再試一個常見的視頻轉錄任務,GPT 5.2 Thinking沒有內置工具,所以它會聯網搜索一個免費轉錄的工具,轉錄后再把結果整理好給我。

      (視頻鏈接)總結這個視頻的記錄,并分享所有學到的知識

      再來再來,

      既然轉錄也能找到免費了,說不定PDF排版也行。


      將這份PDF轉換成可編輯的Word文檔。

      GPT2.5的解法是將圖片和結構圖等截圖放到word里面,我看下來就只有代碼部分會出現行號和文字排版多了換行,其他文字和格式都保留下來了。

      我必須要額外吐槽一下instant,thinking和pro這個后綴,穿插在報告里面看到眼花。我愿稱之為AI界的中杯大杯超大杯


      除了牛馬預備役的設定外,GPT 5.2在ARC-AGI-2的性能也很強,用人話說,就是看看模型在完全沒見過的圖像推理題上表現怎么樣。

      這有個術語,流體智力(Fluid Intelligence),不依賴于已有的知識,在全新情境下進行邏輯推理、識別模式和解決問題的能力。


      我記得第一代的時候我當時找了一堆人,做10條只對了3條。GPT 5.2的得分到了52.9%,比GPT 5.1高35.3%,正確率過半了。

      GPT 5.2有一個我印象比較深刻的case,

      就是這個3D深海,這個光影我反手就是一個3A大作。

      創建一個包含以下要求的單HTML文件單頁應用:

      名稱:海洋波浪模擬

      目標:顯示逼真的動態波浪效果。

      功能:可調節風速、浪高和光照效果。

      界面需具有平靜感和真實感。

      我一開始看那么簡單的提示語嘴都笑歪了,結果后面不只我一個人發現了thinking和pro會時不時降智。

      @向陽喬木用的同一個手柄提示語,用instant,thinking和pro生成的三張圖,

      SVG code for Xbox controller


      所以我后面干脆改用GPT5.2(無后綴版)抽卡了,

      還是可以抽出(抽了一晚上)相當不錯的效果的,

      小球彈跳3D版,

      以及模擬官方case的3D海浪,

      @karminski-牙醫得到的結論也很一樣,下面兩個演示動畫是我節選他跑的一部分效果,

      我覺得可以基本實錘了。

      測試中的GPT 5.2 thinking和pro差距并不大, 但價格差了11倍。大象牙膏測試,甚至不如 GPT5,粒子效果還不如國產開放權重模型,

      鞭炮連鎖爆炸測試, 建模和光照, 粒子效果都非常好, 但追求畫質的結果就是犧牲了性能,

      總的來說,模型寫出來的代碼都挺好看,

      但性能沒太大進步。

      最后,來測試看看GPT5.2的寫作能力吧,

      既然都囊括了44種職業了,那文案是不是也要拉上來。我基本都是一個固定提示語測試,太短了看不出AI味,太多提示語限制的話看不出最低下限

      寫一篇千字的中文科技小說篇章


      盡力了,3k字壓成圖片傳上來還是有點糊的,

      怎么說呢,GPT5.2的AI味還是重,

      破折號雙引號冒號頓號,

      固定的不是...而是的句式還是時不時會彈出來,

      但是這個故事的本身設定我還是很喜歡的,

      不再完美的AI零七和被算法討厭的噪音工程師林佑的聯手還蠻有看點的。

      最后的最后,

      GPT-5.1三個月后也會下線,

      我們又一次告別了一個GPT開頭的模型,

      GPT5.2發布當天,OpenAI十周年這周,

      奧特曼寫了一封公開信《Ten Years》,

      他說,

      再過十年,

      我們幾乎肯定能造出超級智能。

      實話說,我對OpenAI的感情是復雜的,

      Gemini 3.0 Pro 獨一檔強,

      Claude基本不能用的情況下,

      我是真心希望GPT5.2能支棱起來,

      別真被徹底超過了,

      多多優化模型吧。

      @ 作者 / 卡爾

      最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論

      如果想要第一時間收到推送,不妨給我個星標

      更多的內容正在不斷填坑中……


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      瓜帥開超重禁令!1米95英超魔王嚇尿:190斤 還好沒事 4年長1斤肉

      瓜帥開超重禁令!1米95英超魔王嚇尿:190斤 還好沒事 4年長1斤肉

      風過鄉
      2025-12-26 13:06:52
      玉淵譚天|現場畫面!菲律賓在我南海造假擺拍被抓包

      玉淵譚天|現場畫面!菲律賓在我南海造假擺拍被抓包

      環球網資訊
      2025-12-26 21:52:17
      國家衛健委:希望黨政機關、企事業單位、社會組織每年都能組織員工參與團體無償獻血

      國家衛健委:希望黨政機關、企事業單位、社會組織每年都能組織員工參與團體無償獻血

      紅星新聞
      2025-12-26 17:42:26
      中國人壽保險(集團)公司原黨委書記、總裁楊超被開除黨籍

      中國人壽保險(集團)公司原黨委書記、總裁楊超被開除黨籍

      新京報
      2025-12-26 17:03:47
      全軍覆沒!網貸公司盯上印度市場,結果反被三哥收割得體無完膚!

      全軍覆沒!網貸公司盯上印度市場,結果反被三哥收割得體無完膚!

      青青子衿
      2025-12-26 04:42:30
      美媒扒愛德華茲離場前爆笑細節:指著3個裁判一頓痛罵 沒放過一人

      美媒扒愛德華茲離場前爆笑細節:指著3個裁判一頓痛罵 沒放過一人

      Emily說個球
      2025-12-26 16:07:48
      Lisa在圣誕節二登瘋馬秀,由男友三公子陪同,直接打臉洗白的粉絲

      Lisa在圣誕節二登瘋馬秀,由男友三公子陪同,直接打臉洗白的粉絲

      芊手若
      2025-12-26 15:32:19
      佛山企業家被“以刑化債”后,批辦檢察長落馬,法官、律師獲罪

      佛山企業家被“以刑化債”后,批辦檢察長落馬,法官、律師獲罪

      追月數星
      2025-12-26 12:09:28
      泰柬沖突大勢已定,中方送給洪森父子四個字,阿努廷一戰定乾坤?

      泰柬沖突大勢已定,中方送給洪森父子四個字,阿努廷一戰定乾坤?

      書紀文譚
      2025-12-26 14:51:51
      越南樓市失控了

      越南樓市失控了

      格隆匯
      2025-12-26 19:37:05
      《早安隆回》全網播放量超1600億,作者袁樹雄:這首歌讓我的負債沒了,將為2026世界杯寫新歌

      《早安隆回》全網播放量超1600億,作者袁樹雄:這首歌讓我的負債沒了,將為2026世界杯寫新歌

      極目新聞
      2025-12-26 17:59:39
      43犯44罰!6分險勝山東,廣東3人滿分1人奇兵,徐杰打出封神一戰

      43犯44罰!6分險勝山東,廣東3人滿分1人奇兵,徐杰打出封神一戰

      后仰大風車
      2025-12-26 21:48:41
      被閨蜜和丈夫雙重背叛,女子“一夜白頭”!原配告第三者重婚案今日開庭

      被閨蜜和丈夫雙重背叛,女子“一夜白頭”!原配告第三者重婚案今日開庭

      環球網資訊
      2025-12-26 18:39:08
      南博事件新證據!龐叔令律師:龐家捐贈的江南春,不是曝光的兩幅

      南博事件新證據!龐叔令律師:龐家捐贈的江南春,不是曝光的兩幅

      火山詩話
      2025-12-26 07:14:22
      外交部回應日本領導人或參拜靖國神社:日方不要錯上加錯

      外交部回應日本領導人或參拜靖國神社:日方不要錯上加錯

      環球網資訊
      2025-12-26 15:30:50
      21歲男子趁表姐熟睡欲與其發生關系未得逞,家屬賠償10萬獲諒解 一審被判三緩四

      21歲男子趁表姐熟睡欲與其發生關系未得逞,家屬賠償10萬獲諒解 一審被判三緩四

      紅星新聞
      2025-12-26 17:20:10
      天塹變通途!極氪001車隊首批穿越天山勝利隧道,南北疆從此邁入“一日往返”時代

      天塹變通途!極氪001車隊首批穿越天山勝利隧道,南北疆從此邁入“一日往返”時代

      魯中晨報
      2025-12-26 19:16:51
      價格飆升,多地零售價突破10元/斤!年初一斤僅一兩元,網友:雞蛋都快配不上它了……

      價格飆升,多地零售價突破10元/斤!年初一斤僅一兩元,網友:雞蛋都快配不上它了……

      每日經濟新聞
      2025-12-26 10:01:26
      新疆輸球揪出最大毒瘤!拿550萬,罰球4中0,這哪像職業球員

      新疆輸球揪出最大毒瘤!拿550萬,罰球4中0,這哪像職業球員

      籃球專區
      2025-12-26 23:20:00
      劉芳菲登門向龐叔令道歉!眼里滿是淚光,龐叔令拿出一柜子藏品來

      劉芳菲登門向龐叔令道歉!眼里滿是淚光,龐叔令拿出一柜子藏品來

      阿纂看事
      2025-12-26 19:09:14
      2025-12-27 00:48:49
      卡爾的AI沃茨 incentive-icons
      卡爾的AI沃茨
      前大廠算法工程師,3家科技公司技術總監|致力打造最系統的Al學習體系,讓1萬人通過Al提高生產力
      185文章數 63關注度
      往期回顧 全部

      科技要聞

      收割3000億!拼多多"土辦法"熬死所有巨頭

      頭條要聞

      老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

      頭條要聞

      老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

      體育要聞

      開翻航母之后,他決定親手造一艘航母

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經要聞

      投資巨鱷羅杰斯最新持倉:只留四種資產

      汽車要聞

      兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

      態度原創

      旅游
      家居
      藝術
      本地
      公開課

      旅游要聞

      多家博物館公告:暫停開放

      家居要聞

      格調時尚 智慧品質居所

      藝術要聞

      你絕對想不到,佛陀微笑隱藏的秘密竟然是!

      本地新聞

      云游安徽|踏訪池州,讀懂山水間的萬年史書

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久青青草原亚洲AV无码麻豆| 熟女视频在线观看| A在线视频| 色欲av亚洲一区无码少妇| 日韩变态另类| 国产AV中文字幕| 被灌满精子的少妇视频| 熟妇与小伙子matur老熟妇e| 美女内射毛片在线看免费人动物| 久久97| ThePorn人妻白浆| 日韩性色| 男人天堂久久| 亚洲成人在线网址| 国产精品丝袜黑色高跟鞋| 在线观看老湿视频福利| 永久免费无码av在线网站| 蜜臀久久99精品久久久酒店新书| 伊人网视频| 999成人网| 亚洲丝袜熟女在线樱桃| 毛多水多高潮高清视频 | 国产乱人伦无无码视频试看| 亚洲AV无码久久精品色欲| 国产自在自线午夜精品 | 开阳县| 激情五月天婷婷| 亚洲国产精品高清久久久 | 人妻三级成| 2025精品视频| AV一区二区三区| jlzz大jlzz大全免费| 亚洲亚洲人成综合网络| julia无码中文字幕一区| 亚洲一本在线| 成人硅胶娃做爰无码www| 免费观看日本污污ww网站69| 久久天天躁夜夜躁狠狠ds005| 久热在线中文字幕色999舞| 亚洲?欧美?自拍?另类?日韩?人妻| 河北省|