<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<tr id="s3vre"><td id="s3vre"></td></tr>

<sup id="s3vre"></sup>

<ol id="s3vre"></ol>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.2 凌晨發布：這一次，OpenAI 不想做題，只想幫你搞錢！

2025-12-12 08:47:58　來源: AI范兒

上海舉報

0

分享至

★ 設為星標 | 只講人話，帶你玩轉AIGC。

GPT-5.2 終于發布了！

雖然我已經以 Gemini 為主，但 GPT 的每次更新仍然受到極大的關注（包括我）。

這次到底更新了些啥？

簡單來說，各項指標超越 Gemini 3 Pro，讓 OpenAI 居然又重回了王座。

但，并沒有形成那種“外星人降臨”的碾壓優勢。

不過，細節里全是魔鬼。我們具體來扒一扒。

OpenAI 官方開篇定調非常高，直接說 GPT-5.2 是迄今為止功能最強大的專業知識工作模型。

啥叫專業知識工作模型？

把官方那堆技術黑話翻譯一下，意思就是：它不再滿足于當你的陪聊對象，它現在想做你的“腦力合伙人”。

這一次，OpenAI 顯然是急了，它甚至不屑于跟你談什么“通用智能”的夢想，而是把“搞錢”這三個字寫在了臉上。

它這次的技能點，全點在了打工人的痛點上：做表（Excel）、畫餅（PPT）、寫代碼，以及那些讓人頭禿的長文檔。

它就是為了創造“經濟價值”而生的。

到底有多強？聊聊 GDPval。

為了證明自己“值錢”，OpenAI 甚至拋棄了那些傳統的 MMLU 考試分數。

他們拋出了一個聽起來就充滿金錢味道的新指標：GDPval。（這名字一聽就是奔著生產總值GDP去的）

可能很多人沒聽說過這個評測集。這是 OpenAI 專門為了衡量“真實世界打工能力”搞出來的。

他們在 44 個核心職業（律師、市場經理、工程師等）里，找了一幫平均工齡 14 年的資深專家，出了 1320 道真實的“地獄級工作任務” 。

注意，不是做選擇題。是讓你真的去改合同、寫全案 PPT、優化生產線圖紙。這些任務，人類專家平均要花 7 個小時才能做完。

結果呢？經過雙盲測試，GPT-5.2 在 70.9% 的情況下，干得比這些人類專家更好，或者至少打個平手。

圖：在 GDPval 中，模型嘗試完成涵蓋美國 GDP 貢獻最大的九大行業中 44 個職業的特定知識工作

這才是最恐怖的。

它的參照系不是剛畢業的大學生，而是行業專家。也就是說，在一個有著十幾年經驗的采購經理面前，GPT-5.2 干出來的活兒，有七成的時候，比他干得還好。

甚至于說，GPT-5.2 Thinking 生成的電子表格和幻燈片在復雜程度和格式方面都有所提高。

說白了：以前的 GPT 是個學霸，現在的 GPT-5.2 是個熟手。

那么，它是怎么做到這一點的？

這背后其實是一場架構級的革命。

OpenAI 官方直言不諱：這是自 GPT-5 以來，GPT 系列在智能體編程（Agentic Coding）領域跨度最大的一次飛躍。

圖：在SWE-Bench Pro中（在新窗口中打開）? ? ?，給定一個代碼庫，模型必須生成一個補丁來解決一個實際的軟件工程任務。

為了證明自己不是自嗨，他們這次直接拉來了 Windsurf 和 Devin 站臺。這兩位可是現在 AI 編程界的頂流。

官方直接宣布，GPT-5.2 將成為這兩個工具的默認核心模型。

這說明啥？說明這玩意兒已經經受住了最殘酷的生產環境考驗。

但真正讓我覺得牛逼的，是背后的技術邏輯發生了質變。

以前我們為了讓 AI 干點復雜的活，得搭建一套脆弱的“多智能體系統”。

就像拉了一群各懷鬼胎的實習生在開會，一個負責想，一個負責寫，一個負責改，管理起來極其麻煩，還容易崩。

而 GPT-5.2 直接解鎖了一種全新的架構：單一超級智能體（Single Mega-agent）。

這就好比把那一屋子實習生全裁了，換來了一個精通 20 多種工具的全能大神。它不僅反應更快、腦子更靈光，而且維護起來簡單了 100 倍。

除了腦子好，它的“手眼”也進化了。

為了配得上“超級智能體”這個稱號，OpenAI 這次給 GPT-5.2 裝上了更強的配件：

1. 手更快了

以前的 AI 調用工具（比如聯網搜素、畫圖、跑代碼）總有種“卡頓感”。但官方這次特別強調：延遲大幅降低，而且工具調用能力變得極強。

這意味著什么？

意味著它在多個工具之間切換，絲滑得像是在切菜。

它不再是一個個蹦字的聊天機器人，而是一個能瞬間調起計算器、瀏覽器、代碼解釋器的“快手”。嗯？

2. 眼睛更尖了

看一眼官方放出的演示圖：它能直接看懂復雜的波浪模擬參數，甚至能精準識別電路板上的每一個元器件。

圖：GPT 5.2 可以識別出元部件

這說明它的視覺能力已經脫離了“認貓認狗”的初級階段，開始進入工業級的精細識別了。

配合長上下文能力，不管是幾千行的代碼屎山，還是幾十頁的復雜電路圖，它都能一口吞下，并且過目不忘。

實際上，這使得專業人士能夠使用 GPT-5.2 處理長篇文檔，例如報告、合同、研究論文、筆錄和多文件項目，同時在數十萬個詞元中保持一致性和準確性。

圖：GPT 5.2 的長上下文處理

所以，GPT-5.2 特別適合深度分析、綜合和復雜的多源工作流程。

但真正的“重頭戲”，是這個：ARC-AGI 2

如果說 GDPval 是測它能不能干活，那 ARC-AGI 2 就是測它到底有沒有腦子。

老粉都知道，ARC 評測集是 AI 圈最難啃的骨頭，甚至沒有之一。

它是由 Keras 之父 Fran?ois Chollet 搞出來的，專門用來反死記硬背的。

比如這種題目：

圖：ARC AGI2 題目

圖：ARC AGI2 題目

以前的模型，MMLU 這種考試能拿 90 分，一碰到 ARC 這種需要“舉一反三”的智力題，立馬現原形，得分低得可憐。

大家猜猜上一代的 GPT-5.1 Thinking 拿了多少分？

17.6%。

但這次，GPT-5.2 干到了多少？52.9%。

兄弟們，這是 3 倍的暴漲。這不是“擠牙膏”，這是直接把牙膏管踩爆了。

為了讓大家有個概念，目前市面上最強的競品 Gemini 3 Pro 和 Claude，在這個榜單上的分數大約在 31% - 37% 之間（取決于版本）。

也就是說，OpenAI 這一次在純智商層面，不僅甩開了對手，更是跨越了一個巨大的鴻溝。

這意味著 GPT-5.2 終于突破了那層窗戶紙：它開始具備真正的通用推理能力了。

它遇到沒見過的新問題，不再是去翻記憶庫里的答案（因為根本沒有），而是像人類一樣，現場觀察規律、現場推理、現場解決。

順便提一嘴，在另一個數學競賽 AIME 2025 里，GPT-5.2 直接拿了 100% 的滿分。

這可是全美高中數學聯賽。以前我們還在討論 AI 能不能及格，現在它已經把卷子做穿了。

相比于它能多寫兩行代碼，我覺得這一點，才是這次更新里最硬核、最不容忽視的里程碑。

總結一下：

GPT-5.2 Instant、思考版和 Pro 版本今日開始推送，首先面向 Plus、Pro、Business 和 Enterprise 套餐用戶。

免費版和 Go 用戶將于明天獲得訪問權限。

GPT-5.2 在我心中，是一個極其合格，甚至有點“過于務實”的迭代。

它沒有像過去那樣，瘋狂去卷那些虛頭巴腦的考試分數，而是把所有的技能點，都死磕在了“怎么幫白領干活”這件事上。

它不跟你談星辰大海，只跟你談降本增效；不跟你炫耀參數，只給你看GDPval。

這個點，我覺得就很酷，非常的剛需。

雖然從“好玩”或者“科幻感”的角度來說，GPT-5.2 可能沒有 Gemini 3 Pro 原生多模態帶來的那種絲滑震撼。

（畢竟谷歌同步發行了 Nano Banana Pro，期待 GPT Image 早日發布）

但如果你是為了工作，為了搞錢，為了早點下班去陪家人。那 GPT-5.2 可能是目前地表最強、也是最值得你掏錢的生產力工具。

好了，就扒到這里，如果覺得這篇文章對你有用，別忘點贊，??并轉發給你的朋友哦～

我們下次再見。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

谷歌急了！OpenClaw創始人剛跳槽OpenAI，付費用戶連夜被封號

雷科技 2026-02-25 21:48:33
5 跟貼 5
AI能寫COBOL代碼，IBM股價單日蒸發310億美元，創26年最慘紀錄

機器之心Pro 2026-02-25 11:48:13
5 跟貼 5

谷歌做了個論文專用版nano banana！頂會級Figure直出

機器之心Pro 2026-02-05 15:52:42
1 跟貼 1

只要1100美元tokens，一周重寫 Next.js！

機器之心Pro 2026-02-25 16:54:02
0 跟貼 0
馬年4大頂流模型會師阿里云Coding Plan開工！Token量大管飽

量子位 2026-02-25 23:10:53
0 跟貼 0

阿里云推出低價AI編程套餐，集成四大頂級開源模型

華爾街見聞官方 2026-02-26 06:30:00
0 跟貼 0

別再一鍵貼代碼！Anthropic點名3種「用AI不退化」真方法

新智元 2026-02-24 12:33:22
1 跟貼 1
2026年，大模型訓練的下半場屬于「強化學習云」

機器之心Pro 2026-01-12 14:03:47
0 跟貼 0

具身數據戰開打！普通人都能上手，邊采邊篩，只喂機器人愛吃的

量子位 2026-01-12 12:20:02
0 跟貼 0
AI記住失敗經驗：微軟提出Re-TRAC框架，4B性能SOTA，30B超越358B

機器之心Pro 2026-02-25 17:33:51
0 跟貼 0
北航開源Code2Bench：雙擴展動態評測，代碼大模型告別躺平刷分

機器之心Pro 2026-02-25 15:51:27
0 跟貼 0
Anthropic與軟件業合作智能體緩解市場憂慮

虎嗅APP 2026-02-26 06:20:34
0 跟貼 0
AdaResoner實現Agentic Vision的主動「視覺工具思考」

機器之心Pro 2026-02-24 13:58:23
0 跟貼 0
“機器狗”正式下鄉，幫農民收“榨菜”

每日經濟新聞 2026-02-26 00:48:36
0 跟貼 0
人活著的唯一理由是善良

葉檀財經 2026-02-01 17:07:04
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
吃瓜、開會、追熱點，我靠AI穩坐信息高地

36氪 2025-11-27 18:27:11
0 跟貼 0
行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
遭谷歌制裁，OpenClaw創始人：Anthropic會先打電話，直接封號

機器之心Pro 2026-02-25 17:49:33
4 跟貼 4
華為推出軟工代碼智能體SWE-Lego，解鎖SFT訓練極致性能

機器之心Pro 2026-01-13 14:54:45
0 跟貼 0
編程已死，鍵盤長草！Claude Code之父對談Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
64 跟貼 64
土耳其五代機完成迭代！三架原型機同時亮相，設計更加完善

精彩不容錯過 2026-02-23 18:54:45
40 跟貼 40
嫌疑人當面刪代碼，挑釁警察不懂技術，警察自爆身份嚇傻嫌疑人

惠娥輕笑 2026-02-24 10:41:45
1 跟貼 1
龍蝦之父新訪談，OpenClaw內幕公開！攔不住濫用，只勸大家別玩火

量子位 2026-02-25 13:46:20
3 跟貼 3
一封絕密文件被公開，中國曾被寫進核滅絕計劃，他決定了中國底線

獨舞生活 2026-02-21 13:45:00
0 跟貼 0
彭博社消息，Unity考慮出售中國業務，估值或超10億美元

游戲干線 2026-02-25 22:04:54
17 跟貼 17
微信出新功能，網友：簡直是社恐福音

南方都市報 2026-02-25 16:59:07
621 跟貼 621
硅谷科技大廠的員工們，都在怎么應對AI焦慮？

凱莉彭 2026-02-22 20:46:13
0 跟貼 0
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
73 跟貼 73
消費級顯卡可跑！剛剛，阿里Qwen3.5又開源3款新模型

機器之心Pro 2026-02-25 17:09:48
4 跟貼 4
特朗普將召集微軟谷歌等科技巨頭簽署承諾：自行承擔數據中心電費

IT之家 2026-02-26 07:45:07
0 跟貼 0
火爆海外的中國科技，老外大為震撼中國科技正在定義未來！

胡萊克修斯 2026-02-25 04:19:33
0 跟貼 0
300多只東北虎“輕斷食”？景區：每天斷食1個園，司機會帶游客找可投喂區

封面新聞 2026-02-23 16:29:03
1660 跟貼 1660
哈爾濱冰雪大世界：正式閉園

大風新聞 2026-02-21 20:36:03
1869 跟貼 1869
施工現場磚塊運輸過程，看著有點像模型，竟還有點好玩！

幽默小火山 2026-02-25 11:39:53
1 跟貼 1
賴清德終于要上立法院報告了？黃國昌爆出秘密文件！震驚全臺！

新時光點滴 2026-02-24 14:21:32
0 跟貼 0

年輕女孩銀盆嶺大橋跳江，長沙水警4分鐘急速救援，救援人員：還好沒錯過黃金4分鐘！

年輕女孩銀盆嶺大橋跳江，長沙水警4分鐘急速救援，救援人員：還好沒錯過黃金4分鐘！

瀟湘晨報

2026-02-25 20:00:17

32歲小伙瘦骨嶙峋，確診罕見癌癥：我連病友都找不到！杭州醫生：三分之一患者面臨無藥可用困境

32歲小伙瘦骨嶙峋，確診罕見癌癥：我連病友都找不到！杭州醫生：三分之一患者面臨無藥可用困境

極目新聞

2026-02-25 12:38:59

雨+雨夾雪+中到大雪！河北大范圍雨雪要來！

雨+雨夾雪+中到大雪！河北大范圍雨雪要來！

掌中邯鄲

2026-02-25 11:10:27

1萬個避孕套3天秒空！冬奧組委會汗流浹背了

1萬個避孕套3天秒空！冬奧組委會汗流浹背了

品牌營銷報

2026-02-25 09:24:20

勇士爆冷惜敗鵜鶘：梅爾頓28分賽季新高錫安26+6穆雷賽季首秀

勇士爆冷惜敗鵜鶘：梅爾頓28分賽季新高錫安26+6穆雷賽季首秀

醉臥浮生

2026-02-25 11:34:46

41歲獨居女子去世，無法定繼承人，多位旁系親屬爭奪遺產，法院：價值三四百萬元的房產歸國家所有，銀行存款等按幫扶比例進行分配

41歲獨居女子去世，無法定繼承人，多位旁系親屬爭奪遺產，法院：價值三四百萬元的房產歸國家所有，銀行存款等按幫扶比例進行分配

大風新聞

2026-02-25 20:53:04

一篇神文干趴全球股市，AI這孫子真要掀桌子？

一篇神文干趴全球股市，AI這孫子真要掀桌子？

智識漂流

2026-02-25 19:06:22

“初十3不動，動了一年窮”，明日正月初十“地生日”，傳統要懂

“初十3不動，動了一年窮”，明日正月初十“地生日”，傳統要懂

小茉莉美食記

2026-02-25 09:43:12

孫穎莎超絕球品！主動提醒對手可以挑戰，3-1晉級16強約戰石洵瑤

孫穎莎超絕球品！主動提醒對手可以挑戰，3-1晉級16強約戰石洵瑤

乒談

2026-02-25 20:55:47

劉強東，又出手了

中國新聞周刊

2026-02-25 21:26:27

戰爭風險不斷升高！美軍重兵集結中東，“數十年來最大規模”

戰爭風險不斷升高！美軍重兵集結中東，“數十年來最大規模”

環球網資訊

2026-02-25 06:53:10

女子春節返程偶遇10年未見初戀一眼認出車牌號跟上去打了招呼

女子春節返程偶遇10年未見初戀一眼認出車牌號跟上去打了招呼

閃電新聞

2026-02-25 14:43:31

沒詹姆斯，韋德談在NBA合作過的最佳領袖名單中，沒勒布朗詹姆斯

沒詹姆斯，韋德談在NBA合作過的最佳領袖名單中，沒勒布朗詹姆斯

好火子

2026-02-26 03:33:55

湖北一男子因追尾事故，掛后備箱的大鵝被夾死，當事人發聲“不想浪費父母心意，把鵝帶回家吃了”：對方賠了三四百元家禽損失

湖北一男子因追尾事故，掛后備箱的大鵝被夾死，當事人發聲“不想浪費父母心意，把鵝帶回家吃了”：對方賠了三四百元家禽損失

大象新聞

2026-02-25 22:45:06

陳天龍接受審查調查

吉刻新聞

2026-02-25 09:23:20

熱播短劇被指出現男演員揩油女演員鏡頭，目前爭議鏡頭已刪除，劇方尚未回應

熱播短劇被指出現男演員揩油女演員鏡頭，目前爭議鏡頭已刪除，劇方尚未回應

瀟湘晨報

2026-02-25 17:55:25

“考研出分”沖上熱搜第一！官網披露，引關注……

“考研出分”沖上熱搜第一！官網披露，引關注……

環球網資訊

2026-02-24 14:53:15

【獨家】魅族手機或將成為歷史：業務實質性停擺，3月正式退市

【獨家】魅族手機或將成為歷史：業務實質性停擺，3月正式退市

界面新聞

2026-02-25 18:25:25

白天作陪晚上同宿？明碼標價8000一回！高端伴游淪為色情交易窩點

白天作陪晚上同宿？明碼標價8000一回！高端伴游淪為色情交易窩點

網絡易不易

2026-01-20 10:17:46

65歲男子和10歲繼女：大量不雅照流出，細節披露，一畫面難以啟齒

65歲男子和10歲繼女：大量不雅照流出，細節披露，一畫面難以啟齒

博士觀察

2026-02-25 22:27:52

AI范兒是一個專注于人工智能領域的資訊和學習平臺，提供最新的人工智能資訊

665文章數 457關注度

往期回顧全部

科技要聞

“機器人只跳舞，沒什么用”

頭條要聞

日本計劃部署導彈部隊距臺灣僅110公里中方強硬表態

頭條要聞

日本計劃部署導彈部隊距臺灣僅110公里中方強硬表態

體育要聞

勇士爆冷惜敗鵜鶘梅爾頓28分賽季新高

娛樂要聞

黃曉明新戀情！與小22歲美女同游新加坡

財經要聞

上海樓市放大招，地產預期別太大

汽車要聞

750km超長續航 2026款小鵬X9純電版將于3月2日上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產

數碼

旅游

游戲

藝術

房產要聞

海南樓市春節熱銷地圖曝光！三亞、陵水又殺瘋了！

數碼要聞

音質降噪全升級！三星Buds 4系列正式發布 179美元起

旅游要聞

避開日本，中國游客推動泰國旅游業復蘇

《33號遠征隊》發行商：游戲定價低是重要成功因素

藝術要聞

這些作品太美了，仙氣飄飄，三位大咖不容錯過！

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<tr id="y8kpc"><span id="y8kpc"></span></tr>

<p id="y8kpc"></p>

<ruby id="y8kpc"><samp id="y8kpc"><pre id="y8kpc"></pre></samp></ruby>