<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      實測GPT5.2打工人版的十種用法,我覺得Gemini 3 Pro要笑到肚子痛了

      0
      分享至

      新鮮出爐的GPT5.2又一次成“最強”了,

      這次居然沒有開發布會,浪費了我二十分鐘,

      現在應該已經全量上線到ChatGPT了,在OpenAI platform,Cursor,Codex,Perplexity上也能用到,這次API貴了40%,要好好看看值不值。

      我第一時間就跟Gemini 3 Pro,做了個編程對比,還盤點了10種GPT5.2的玩法。直接打印機起手,

      GPT5.2,

      Gemini 3 Pro,

      enmmm,有點不對,

      再看看OpenAI自己放出來的主case呢,

      一個電腦主板上面的元件和接口識別標記的case,結果連Gemini 2.5 Pro都沒打贏




      這批測試的超長提示語和代碼我都打包好了,公眾號后臺發我“gpt5.2”就行

      難道是我報告看劈叉了,再翻翻還是很頂,

      在AIME 2025(競賽數學)拿滿分,在 ARC-AGI-2(視覺推理)上拿到了 52.9%(翻了三倍,和 Gemini3 相當),在SWE-Bench Pro(軟件工程)、GPQA Diamond(科學問題)上也搶回第一了,

      256K文檔的四針測試正確率離譜到100%,知識截止日期也更新到25年8月份了。

      怪不得之前有人P圖GPT5.2全系第一。。。


      重點在GDPval和ARC-AGI-2,


      簡單來說,OpenAI想測試模型在真實世界對GDP的貢獻,可以說是賺錢能力,

      GDPval這數據集就是從銀行那調取的信息,選出對美國 GDP 貢獻最大的 9 個行業中選出的 44 種職業,


      1,320 個專業任務,每個任務都由平均有 14 年以上領域經驗的專業人士設計,任務本體包含了參考文件和背景信息,預期的輸出涵蓋文檔、ppt、圖表、電子表格和多媒體。


      https://arxiv.org/pdf/2510.04374

      測試的case長這樣,GPT 5.2 Thinking的平均得分比GPT 5.1 Thinking高9.3%,還是比較明顯能看到區別的。


      我用Gemini 3 Pro搓了一個賊復雜的Excel提示語,直接搭一個完整的模型。

      你要在 Excel 里從零構建一個可運營的商業預測模型,用于蜜雪冰城在12月內的 定價、銷量、收入、成本、費用、利潤、現金流 預測,并支持多情景對比與關鍵指標儀表盤。

      目標讀者是業務負責人和財務負責人,要求模型結構清晰、可審計、可擴展,所有計算使用 Excel 原生公式完成(不依賴宏)。

      (后面是每張表的詳細設定)

      GPT 5.2 Thinking跑啊跑,跑了半小時,

      把我所有的要求都實現了,

      以后出門在外自稱是Excel專家沒得問題了。

      再試一個常見的視頻轉錄任務,GPT 5.2 Thinking沒有內置工具,所以它會聯網搜索一個免費轉錄的工具,轉錄后再把結果整理好給我。

      (視頻鏈接)總結這個視頻的記錄,并分享所有學到的知識

      再來再來,

      既然轉錄也能找到免費了,說不定PDF排版也行。


      將這份PDF轉換成可編輯的Word文檔。

      GPT2.5的解法是將圖片和結構圖等截圖放到word里面,我看下來就只有代碼部分會出現行號和文字排版多了換行,其他文字和格式都保留下來了。

      我必須要額外吐槽一下instant,thinking和pro這個后綴,穿插在報告里面看到眼花。我愿稱之為AI界的中杯大杯超大杯


      除了牛馬預備役的設定外,GPT 5.2在ARC-AGI-2的性能也很強,用人話說,就是看看模型在完全沒見過的圖像推理題上表現怎么樣。

      這有個術語,流體智力(Fluid Intelligence),不依賴于已有的知識,在全新情境下進行邏輯推理、識別模式和解決問題的能力。


      我記得第一代的時候我當時找了一堆人,做10條只對了3條。GPT 5.2的得分到了52.9%,比GPT 5.1高35.3%,正確率過半了。

      GPT 5.2有一個我印象比較深刻的case,

      就是這個3D深海,這個光影我反手就是一個3A大作。

      創建一個包含以下要求的單HTML文件單頁應用:

      名稱:海洋波浪模擬

      目標:顯示逼真的動態波浪效果。

      功能:可調節風速、浪高和光照效果。

      界面需具有平靜感和真實感。

      我一開始看那么簡單的提示語嘴都笑歪了,結果后面不只我一個人發現了thinking和pro會時不時降智。

      @向陽喬木用的同一個手柄提示語,用instant,thinking和pro生成的三張圖,

      SVG code for Xbox controller


      所以我后面干脆改用GPT5.2(無后綴版)抽卡了,

      還是可以抽出(抽了一晚上)相當不錯的效果的,

      小球彈跳3D版,

      以及模擬官方case的3D海浪,

      @karminski-牙醫得到的結論也很一樣,下面兩個演示動畫是我節選他跑的一部分效果,

      我覺得可以基本實錘了。

      測試中的GPT 5.2 thinking和pro差距并不大, 但價格差了11倍。大象牙膏測試,甚至不如 GPT5,粒子效果還不如國產開放權重模型,

      鞭炮連鎖爆炸測試, 建模和光照, 粒子效果都非常好, 但追求畫質的結果就是犧牲了性能,

      總的來說,模型寫出來的代碼都挺好看,

      但性能沒太大進步。

      最后,來測試看看GPT5.2的寫作能力吧,

      既然都囊括了44種職業了,那文案是不是也要拉上來。我基本都是一個固定提示語測試,太短了看不出AI味,太多提示語限制的話看不出最低下限

      寫一篇千字的中文科技小說篇章


      盡力了,3k字壓成圖片傳上來還是有點糊的,

      怎么說呢,GPT5.2的AI味還是重,

      破折號雙引號冒號頓號,

      固定的不是...而是的句式還是時不時會彈出來,

      但是這個故事的本身設定我還是很喜歡的,

      不再完美的AI零七和被算法討厭的噪音工程師林佑的聯手還蠻有看點的。

      最后的最后,

      GPT-5.1三個月后也會下線,

      我們又一次告別了一個GPT開頭的模型,

      GPT5.2發布當天,OpenAI十周年這周,

      奧特曼寫了一封公開信《Ten Years》,

      他說,

      再過十年,

      我們幾乎肯定能造出超級智能。

      實話說,我對OpenAI的感情是復雜的,

      Gemini 3.0 Pro 獨一檔強,

      Claude基本不能用的情況下,

      我是真心希望GPT5.2能支棱起來,

      別真被徹底超過了,

      多多優化模型吧。

      @ 作者 / 卡爾

      最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論

      如果想要第一時間收到推送,不妨給我個星標

      更多的內容正在不斷填坑中……


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      威爾士公開賽16強出爐附賽程,張安達vs希金斯,8強中國有望占4席

      威爾士公開賽16強出爐附賽程,張安達vs希金斯,8強中國有望占4席

      小火箭愛體育
      2026-02-26 09:05:55
      中方第五波反制,巴拿馬以為接管港口就高枕無憂,結果自斷后路!

      中方第五波反制,巴拿馬以為接管港口就高枕無憂,結果自斷后路!

      真的好愛你
      2026-02-26 10:33:10
      印軍前總長親手拆臺:印軍白死了!加勒萬那夜,印度輸的不是一點

      印軍前總長親手拆臺:印軍白死了!加勒萬那夜,印度輸的不是一點

      愛吃醋的貓咪
      2026-02-26 13:49:14
      000826,瞬間漲停!多股跟隨大漲

      000826,瞬間漲停!多股跟隨大漲

      數據寶
      2026-02-26 15:01:45
      解放臺灣需要多久?解放軍中將給出準確答案

      解放臺灣需要多久?解放軍中將給出準確答案

      阿七說體育
      2026-02-25 13:19:06
      川大導師威脅,敢管就報復,賣房帶經費回日,校方:已啟動調查

      川大導師威脅,敢管就報復,賣房帶經費回日,校方:已啟動調查

      夢錄的西方史話
      2026-02-23 17:53:25
      登封中靈山失聯女子墜亡后續,父親悲痛發聲,河南網友透露內情

      登封中靈山失聯女子墜亡后續,父親悲痛發聲,河南網友透露內情

      離離言幾許
      2026-02-25 18:44:49
      陳坤之子陳尊佑生母真相11年前就已大白天下

      陳坤之子陳尊佑生母真相11年前就已大白天下

      錯過美好
      2026-02-14 21:17:01
      云南大關縣準備整體搬遷,昭通市劃出一個鎮,作為大關未來新縣城

      云南大關縣準備整體搬遷,昭通市劃出一個鎮,作為大關未來新縣城

      寶哥精彩賽事
      2026-02-26 14:25:19
      上海這晚,57歲周濤秒了30歲李雪琴,不愧是央視嚴選的國泰民安臉

      上海這晚,57歲周濤秒了30歲李雪琴,不愧是央視嚴選的國泰民安臉

      大鐵貓娛樂
      2026-02-08 00:10:03
      WTT爆大冷!男單8強對陣出爐,莫雷加德強勢零封,王楚欽壓軸登場

      WTT爆大冷!男單8強對陣出爐,莫雷加德強勢零封,王楚欽壓軸登場

      不似少年游
      2026-02-26 11:43:44
      出大事了,特朗普不宣而戰,美軍在國際水域開火,多人當場身亡

      出大事了,特朗普不宣而戰,美軍在國際水域開火,多人當場身亡

      小小科普員
      2026-02-26 14:12:17
      WOC!哈登!麻了,騎士心碎了...

      WOC!哈登!麻了,騎士心碎了...

      技巧君侃球
      2026-02-26 15:18:22
      26歲全身潰爛不治而亡,被全家8口吸血多年

      26歲全身潰爛不治而亡,被全家8口吸血多年

      仙味少女心
      2026-01-31 23:14:30
      廣東36歲媽媽,生7個孩子,交幾百萬社會撫養費,拒一千萬生意

      廣東36歲媽媽,生7個孩子,交幾百萬社會撫養費,拒一千萬生意

      三農老歷
      2026-02-26 10:38:37
      破冰失敗,中國拒絕給立陶宛好臉色,前總理炮轟現政府“瞎操作”

      破冰失敗,中國拒絕給立陶宛好臉色,前總理炮轟現政府“瞎操作”

      劉浶開挖機
      2026-02-26 14:51:42
      柯文哲怒嗆卓榮泰:你若明著講“陸配是外國人”,就直接讓李貞秀下臺

      柯文哲怒嗆卓榮泰:你若明著講“陸配是外國人”,就直接讓李貞秀下臺

      海峽導報社
      2026-02-26 11:50:03
      伊美第三輪談判今啟 美方硬性要求遭披露

      伊美第三輪談判今啟 美方硬性要求遭披露

      極目新聞
      2026-02-26 06:34:28
      3-1橫掃!21歲陳垣宇全面升級,張本智和壓力拉滿

      3-1橫掃!21歲陳垣宇全面升級,張本智和壓力拉滿

      羅納爾說個球
      2026-02-26 15:24:31
      85歲大爺自述:去過養老院雇過保姆,才明白晚年最好的歸宿在哪兒

      85歲大爺自述:去過養老院雇過保姆,才明白晚年最好的歸宿在哪兒

      拾代談生活
      2026-02-26 11:09:38
      2026-02-26 16:20:49
      卡爾的AI沃茨 incentive-icons
      卡爾的AI沃茨
      前大廠算法工程師,3家科技公司技術總監|致力打造最系統的Al學習體系,讓1萬人通過Al提高生產力
      219文章數 101關注度
      往期回顧 全部

      科技要聞

      單季營收681億凈利429億!英偉達再次炸裂

      頭條要聞

      德國總理參觀宇樹科技 王興興回應

      頭條要聞

      德國總理參觀宇樹科技 王興興回應

      體育要聞

      從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

      娛樂要聞

      尼格買提撒貝寧滑雪被偶遇 17年老友情

      財經要聞

      人民幣升破6.85,創3年新高

      汽車要聞

      第五代宏光MINIEV煥新 四門玩趣代步車來襲

      態度原創

      房產
      游戲
      時尚
      親子
      軍事航空

      房產要聞

      2.2萬/m2起!三亞主城性價比標桿 海墾·桃花源實景現房春節被瘋搶

      《古墓麗影:催化劑》演員談新版勞拉:集歷代之大成

      無論幾歲,好心態萬歲!

      親子要聞

      3歲女兒真能臭美,自己在家化妝臭美,老公氣得直埋怨媳婦

      軍事要聞

      美政府給新伊核協議設限內容遭披露

      無障礙瀏覽 進入關懷版