<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.2 凌晨發布:這一次,OpenAI 不想做題,只想幫你搞錢!

      0
      分享至

      ★ 設為星標 | 只講人話,帶你玩轉AIGC。

      GPT-5.2 終于發布了!

      雖然我已經以 Gemini 為主,但 GPT 的每次更新仍然受到極大的關注(包括我)。


      這次到底更新了些啥?

      簡單來說,各項指標超越 Gemini 3 Pro,讓 OpenAI 居然又重回了王座。


      但,并沒有形成那種“外星人降臨”的碾壓優勢。

      不過,細節里全是魔鬼。我們具體來扒一扒。

      OpenAI 官方開篇定調非常高,直接說 GPT-5.2 是迄今為止功能最強大的專業知識工作模型。

      啥叫專業知識工作模型?

      把官方那堆技術黑話翻譯一下,意思就是:它不再滿足于當你的陪聊對象,它現在想做你的“腦力合伙人”。

      這一次,OpenAI 顯然是急了,它甚至不屑于跟你談什么“通用智能”的夢想,而是把“搞錢”這三個字寫在了臉上。

      它這次的技能點,全點在了打工人的痛點上:做表(Excel)、畫餅(PPT)、寫代碼,以及那些讓人頭禿的長文檔。

      它就是為了創造“經濟價值”而生的 。

      到底有多強?聊聊 GDPval。

      為了證明自己“值錢”,OpenAI 甚至拋棄了那些傳統的 MMLU 考試分數。

      他們拋出了一個聽起來就充滿金錢味道的新指標:GDPval。 (這名字一聽就是奔著生產總值GDP去的)

      可能很多人沒聽說過這個評測集。 這是 OpenAI 專門為了衡量“真實世界打工能力”搞出來的。

      他們在 44 個核心職業(律師、市場經理、工程師等)里,找了一幫平均工齡 14 年的資深專家,出了 1320 道真實的“地獄級工作任務” 。

      注意,不是做選擇題。 是讓你真的去改合同、寫全案 PPT、優化生產線圖紙。這些任務,人類專家平均要花 7 個小時才能做完 。

      結果呢?經過雙盲測試,GPT-5.2 在 70.9% 的情況下,干得比這些人類專家更好,或者至少打個平手 。


      圖:在 GDPval 中,模型嘗試完成涵蓋美國 GDP 貢獻最大的九大行業中 44 個職業的特定知識工作

      這才是最恐怖的。

      它的參照系不是剛畢業的大學生,而是行業專家。 也就是說,在一個有著十幾年經驗的采購經理面前,GPT-5.2 干出來的活兒,有七成的時候,比他干得還好。

      甚至于說,GPT-5.2 Thinking 生成的電子表格和幻燈片在復雜程度和格式方面都有所提高。


      說白了: 以前的 GPT 是個學霸,現在的 GPT-5.2 是個熟手。

      那么,它是怎么做到這一點的?

      這背后其實是一場架構級的革命。

      OpenAI 官方直言不諱:這是自 GPT-5 以來,GPT 系列在智能體編程(Agentic Coding)領域跨度最大的一次飛躍。


      圖:在SWE-Bench Pro中(在新窗口中打開)? ? ?,給定一個代碼庫,模型必須生成一個補丁來解決一個實際的軟件工程任務。

      為了證明自己不是自嗨,他們這次直接拉來了 Windsurf 和 Devin 站臺。 這兩位可是現在 AI 編程界的頂流。

      官方直接宣布,GPT-5.2 將成為這兩個工具的默認核心模型 。

      這說明啥?說明這玩意兒已經經受住了最殘酷的生產環境考驗。

      但真正讓我覺得牛逼的,是背后的技術邏輯發生了質變。

      以前我們為了讓 AI 干點復雜的活,得搭建一套脆弱的“多智能體系統”。

      就像拉了一群各懷鬼胎的實習生在開會,一個負責想,一個負責寫,一個負責改,管理起來極其麻煩,還容易崩 。

      而 GPT-5.2 直接解鎖了一種全新的架構:單一超級智能體(Single Mega-agent)。

      這就好比把那一屋子實習生全裁了,換來了一個精通 20 多種工具的全能大神 。它不僅反應更快、腦子更靈光,而且維護起來簡單了 100 倍。

      除了腦子好,它的“手眼”也進化了。

      為了配得上“超級智能體”這個稱號,OpenAI 這次給 GPT-5.2 裝上了更強的配件:

      1. 手更快了

      以前的 AI 調用工具(比如聯網搜素、畫圖、跑代碼)總有種“卡頓感”。但官方這次特別強調:延遲大幅降低,而且工具調用能力變得極強。

      這意味著什么?

      意味著它在多個工具之間切換,絲滑得像是在切菜。

      它不再是一個個蹦字的聊天機器人,而是一個能瞬間調起計算器、瀏覽器、代碼解釋器的“快手”。嗯?

      2. 眼睛更尖了

      看一眼官方放出的演示圖: 它能直接看懂復雜的波浪模擬參數,甚至能精準識別電路板上的每一個元器件。


      圖:GPT 5.2 可以識別出元部件

      這說明它的視覺能力已經脫離了“認貓認狗”的初級階段,開始進入工業級的精細識別了。

      配合長上下文能力 ,不管是幾千行的代碼屎山,還是幾十頁的復雜電路圖,它都能一口吞下,并且過目不忘。

      實際上,這使得專業人士能夠使用 GPT-5.2 處理長篇文檔,例如報告、合同、研究論文、筆錄和多文件項目,同時在數十萬個詞元中保持一致性和準確性。


      圖:GPT 5.2 的長上下文處理

      所以,GPT-5.2 特別適合深度分析、綜合和復雜的多源工作流程。

      但真正的“重頭戲”,是這個:ARC-AGI 2

      如果說 GDPval 是測它能不能干活,那 ARC-AGI 2 就是測它到底有沒有腦子。

      老粉都知道,ARC 評測集是 AI 圈最難啃的骨頭,甚至沒有之一。

      它是由 Keras 之父 Fran?ois Chollet 搞出來的,專門用來反死記硬背的。

      比如這種題目:


      圖:ARC AGI2 題目


      圖:ARC AGI2 題目

      以前的模型,MMLU 這種考試能拿 90 分,一碰到 ARC 這種需要“舉一反三”的智力題,立馬現原形,得分低得可憐。

      大家猜猜上一代的 GPT-5.1 Thinking 拿了多少分?

      17.6%。

      但這次,GPT-5.2 干到了多少?52.9%。

      兄弟們,這是 3 倍的暴漲。這不是“擠牙膏”,這是直接把牙膏管踩爆了。

      為了讓大家有個概念,目前市面上最強的競品 Gemini 3 Pro 和 Claude,在這個榜單上的分數大約在 31% - 37% 之間(取決于版本)。


      也就是說,OpenAI 這一次在純智商層面,不僅甩開了對手,更是跨越了一個巨大的鴻溝。

      這意味著 GPT-5.2 終于突破了那層窗戶紙:它開始具備真正的通用推理能力了。

      它遇到沒見過的新問題,不再是去翻記憶庫里的答案(因為根本沒有),而是像人類一樣,現場觀察規律、現場推理、現場解決。

      順便提一嘴,在另一個數學競賽 AIME 2025 里,GPT-5.2 直接拿了 100% 的滿分。

      這可是全美高中數學聯賽。 以前我們還在討論 AI 能不能及格,現在它已經把卷子做穿了。

      相比于它能多寫兩行代碼,我覺得這一點,才是這次更新里最硬核、最不容忽視的里程碑。

      總結一下:

      GPT-5.2 Instant、思考版和 Pro 版本今日開始推送,首先面向 Plus、Pro、Business 和 Enterprise 套餐用戶。

      免費版和 Go 用戶將于明天獲得訪問權限。

      GPT-5.2 在我心中,是一個極其合格,甚至有點“過于務實”的迭代。

      它沒有像過去那樣,瘋狂去卷那些虛頭巴腦的考試分數,而是把所有的技能點,都死磕在了“怎么幫白領干活”這件事上。

      它不跟你談星辰大海,只跟你談降本增效;不跟你炫耀參數,只給你看GDPval。

      這個點,我覺得就很酷,非常的剛需。

      雖然從“好玩”或者“科幻感”的角度來說,GPT-5.2 可能沒有 Gemini 3 Pro 原生多模態帶來的那種絲滑震撼。

      (畢竟谷歌同步發行了 Nano Banana Pro,期待 GPT Image 早日發布)

      但如果你是為了工作,為了搞錢,為了早點下班去陪家人。那 GPT-5.2 可能是目前地表最強、也是最值得你掏錢的生產力工具 。

      好了,就扒到這里,如果覺得這篇文章對你有用,別忘點贊,??并轉發給你的朋友哦~

      我們下次再見。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      年輕女孩銀盆嶺大橋跳江,長沙水警4分鐘急速救援,救援人員:還好沒錯過黃金4分鐘!

      年輕女孩銀盆嶺大橋跳江,長沙水警4分鐘急速救援,救援人員:還好沒錯過黃金4分鐘!

      瀟湘晨報
      2026-02-25 20:00:17
      32歲小伙瘦骨嶙峋,確診罕見癌癥:我連病友都找不到!杭州醫生:三分之一患者面臨無藥可用困境

      32歲小伙瘦骨嶙峋,確診罕見癌癥:我連病友都找不到!杭州醫生:三分之一患者面臨無藥可用困境

      極目新聞
      2026-02-25 12:38:59
      雨+雨夾雪+中到大雪!河北大范圍雨雪要來!

      雨+雨夾雪+中到大雪!河北大范圍雨雪要來!

      掌中邯鄲
      2026-02-25 11:10:27
      1萬個避孕套3天秒空!冬奧組委會汗流浹背了

      1萬個避孕套3天秒空!冬奧組委會汗流浹背了

      品牌營銷報
      2026-02-25 09:24:20
      勇士爆冷惜敗鵜鶘:梅爾頓28分賽季新高 錫安26+6穆雷賽季首秀

      勇士爆冷惜敗鵜鶘:梅爾頓28分賽季新高 錫安26+6穆雷賽季首秀

      醉臥浮生
      2026-02-25 11:34:46
      41歲獨居女子去世,無法定繼承人,多位旁系親屬爭奪遺產,法院:價值三四百萬元的房產歸國家所有,銀行存款等按幫扶比例進行分配

      41歲獨居女子去世,無法定繼承人,多位旁系親屬爭奪遺產,法院:價值三四百萬元的房產歸國家所有,銀行存款等按幫扶比例進行分配

      大風新聞
      2026-02-25 20:53:04
      一篇神文干趴全球股市,AI這孫子真要掀桌子?

      一篇神文干趴全球股市,AI這孫子真要掀桌子?

      智識漂流
      2026-02-25 19:06:22
      “初十3不動,動了一年窮”,明日正月初十“地生日”,傳統要懂

      “初十3不動,動了一年窮”,明日正月初十“地生日”,傳統要懂

      小茉莉美食記
      2026-02-25 09:43:12
      孫穎莎超絕球品!主動提醒對手可以挑戰,3-1晉級16強約戰石洵瑤

      孫穎莎超絕球品!主動提醒對手可以挑戰,3-1晉級16強約戰石洵瑤

      乒談
      2026-02-25 20:55:47
      劉強東,又出手了

      劉強東,又出手了

      中國新聞周刊
      2026-02-25 21:26:27
      戰爭風險不斷升高!美軍重兵集結中東,“數十年來最大規模”

      戰爭風險不斷升高!美軍重兵集結中東,“數十年來最大規模”

      環球網資訊
      2026-02-25 06:53:10
      女子春節返程偶遇10年未見初戀 一眼認出車牌號跟上去打了招呼

      女子春節返程偶遇10年未見初戀 一眼認出車牌號跟上去打了招呼

      閃電新聞
      2026-02-25 14:43:31
      沒詹姆斯,韋德談在NBA合作過的最佳領袖名單中,沒勒布朗詹姆斯

      沒詹姆斯,韋德談在NBA合作過的最佳領袖名單中,沒勒布朗詹姆斯

      好火子
      2026-02-26 03:33:55
      湖北一男子因追尾事故,掛后備箱的大鵝被夾死,當事人發聲“不想浪費父母心意,把鵝帶回家吃了”:對方賠了三四百元家禽損失

      湖北一男子因追尾事故,掛后備箱的大鵝被夾死,當事人發聲“不想浪費父母心意,把鵝帶回家吃了”:對方賠了三四百元家禽損失

      大象新聞
      2026-02-25 22:45:06
      陳天龍接受審查調查

      陳天龍接受審查調查

      吉刻新聞
      2026-02-25 09:23:20
      熱播短劇被指出現男演員揩油女演員鏡頭,目前爭議鏡頭已刪除,劇方尚未回應

      熱播短劇被指出現男演員揩油女演員鏡頭,目前爭議鏡頭已刪除,劇方尚未回應

      瀟湘晨報
      2026-02-25 17:55:25
      “考研出分”沖上熱搜第一!官網披露,引關注……

      “考研出分”沖上熱搜第一!官網披露,引關注……

      環球網資訊
      2026-02-24 14:53:15
      【獨家】魅族手機或將成為歷史:業務實質性停擺,3月正式退市

      【獨家】魅族手機或將成為歷史:業務實質性停擺,3月正式退市

      界面新聞
      2026-02-25 18:25:25
      白天作陪晚上同宿?明碼標價8000一回!高端伴游淪為色情交易窩點

      白天作陪晚上同宿?明碼標價8000一回!高端伴游淪為色情交易窩點

      網絡易不易
      2026-01-20 10:17:46
      65歲男子和10歲繼女:大量不雅照流出,細節披露,一畫面難以啟齒

      65歲男子和10歲繼女:大量不雅照流出,細節披露,一畫面難以啟齒

      博士觀察
      2026-02-25 22:27:52
      2026-02-26 08:08:49
      AI范兒 incentive-icons
      AI范兒
      AI范兒是一個專注于人工智能領域的資訊和學習平臺,提供最新的人工智能資訊
      665文章數 457關注度
      往期回顧 全部

      科技要聞

      “機器人只跳舞,沒什么用”

      頭條要聞

      日本計劃部署導彈部隊距臺灣僅110公里 中方強硬表態

      頭條要聞

      日本計劃部署導彈部隊距臺灣僅110公里 中方強硬表態

      體育要聞

      勇士爆冷惜敗鵜鶘 梅爾頓28分賽季新高

      娛樂要聞

      黃曉明新戀情!與小22歲美女同游新加坡

      財經要聞

      上海樓市放大招,地產預期別太大

      汽車要聞

      750km超長續航 2026款小鵬X9純電版將于3月2日上市

      態度原創

      房產
      數碼
      旅游
      游戲
      藝術

      房產要聞

      海南樓市春節熱銷地圖曝光!三亞、陵水又殺瘋了!

      數碼要聞

      音質降噪全升級!三星Buds 4系列正式發布 179美元起

      旅游要聞

      避開日本,中國游客推動泰國旅游業復蘇

      《33號遠征隊》發行商:游戲定價低是重要成功因素

      藝術要聞

      這些作品太美了,仙氣飄飄,三位大咖不容錯過!

      無障礙瀏覽 進入關懷版