<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<wbr id="lv6l9"></wbr>

<em id="lv6l9"></em>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

剛剛，ChatGPT 和 Claude 同時大更新，不會給 AI 當老板的打工人要被淘汰

2026-02-06 06:28:21　來源: 愛范兒

廣東舉報

0

分享至

就在剛剛，硅谷 AI 圈上演了一出「火星撞地球」。

OpenAI 和 Anthropic 像約好了一樣，同時甩出了自家的重磅更新：Claude Opus 4.6 和 GPT-5.3-Codex。

如果說昨晚之前，我們還在討論「怎么寫好 Prompt 輔助工作」；那么今天凌晨，我們可能被迫要學會「如何作為老板去管理 AI 員工」。

AI 造 AI，順便接管你的電腦

就在昨天，Sam Altman 剛在 X 平臺上凡爾賽了一把 Codex 的「百萬活躍用戶」里程碑。短短一天后，OpenAI 再次乘勝追擊，扔出王炸——GPT-5.3-Codex。

技術文檔里藏著一句極具分量的話：「這是我們第一個在創造自己的過程中，發揮了關鍵作用的模型。」

說人話就是：AI 已經學會了自己寫代碼、自己找 Bug，甚至開始自己訓練下一代的 AI 了。這種自我進化能力，也直接體現在了一連串跑分數據上。

還記得那個模擬人類操作電腦的 OSWorld-Verified 基準測試嗎？前代模型只有 38.2% 的準確率，連及格線都夠不上。

但這次，GPT-5.3-Codex 直接跳漲到了 64.7%！

要知道，人類的平均水平也就 72%。這意味著，AI 距離像你一樣熟練地甩鼠標、切屏、操作軟件，只剩下一層窗戶紙的距離。

而在 Terminal-Bench 2.0（命令行操作）中，它更是拿下了 77.3% 的高分，把 GPT-5.2（62.2%）遠遠甩在身后。

知名 SWE-Bench Pro 基準測試覆蓋四種編程語言，不僅抗污染，還全是真實世界的硬核工程難題。

GPT-5.3-Codex 在這里不僅拿下了 SOTA（最高水平），而且用的 Token 比以往任何模型都少。這意味著什么？意味著它不僅干活猛，解決問題的路徑還比人類更短、更省錢。

OpenAI 甚至展示了它獨立構建的能力：

在幾天內，它從零構建了一款包含多張地圖的賽車游戲 v2，順手還搞定了一款管理氧氣系統的深海潛水游戲。

最讓我印象深刻的是 GPT-5.3-Codex 對模糊意圖的理解。

在構建「Quiet KPI」落地頁時，它自動把「年度計劃」換算成了「打折后的月付價格」，甚至還貼心地自動補充了用戶評價輪播——這一切，都不需要你下指令。

OpenAI 的野心已經寫在臉上了：以前微軟常說 AI 將會成為人類的副駕駛（Copilot），但現在 AI 更想做那個能掌控方向盤、甚至能自己修車的司機。

對了，還有一個有趣的細節。

此前外界盛傳 OpenAI 對英偉達的 AI 芯片頗有微詞，但這次官方博客特地強調：GPT-5.3-Codex 的設計、訓練和部署都在 NVIDIA GB200 NVL72 系統上完成。

這一波高情商的「感謝英偉達」，屬實是給足了黃仁勛面子。

告別「金魚記憶」Claude 迎來絕地反擊

在 GPT-5.3-Codex 發布的前后腳，Anthropic 也端出了自己的春節大禮包。

壞消息是，大家期待的 Claude「中杯」Sonnet 模型沒有更新；但好消息是，Anthropic 直接端出了「超大杯」—— Claude Opus 4.6。

相比于 OpenAI 在「行動力」上的激進，Anthropic 今天發布的 Claude Opus 4.6 則是在「思考力」和「可用性」上死磕。

很多企業用戶都有一個名為 Context Rot（上下文腐蝕）的痛點：號稱支持 200k 上下文，但塞進去的數據一多，AI 就開始顧頭不顧尾。

這次，Claude Opus 4.6 拿出的數據簡直是「降維打擊」。

在 MRCR v2（長文本大海撈針）測試中，Claude Opus 4.6 的召回率高達 76%。

作為對比，上一代 Sonnet 4.5 只有慘不忍睹的 18.5%。從某種程度上說，這是一個從基本不可用到「高可靠」的質變。

這是 Claude Opus 4.6 首次引入了真正可用的 1M 上下文窗口。

這意味著什么？意味著你可以把幾百頁的財報、幾十萬字的代碼庫直接扔給它，它不僅能讀完，還能精準地告訴你第 342 頁腳注里的那個數字有問題。

更讓打工人眼前一亮的是它的生產力功能。

一方面，Anthropic 這回直接把 Claude 塞進了 Excel 和 PowerPoint。它能根據 Excel 數據直接生成 PPT，不僅保留排版風格，連字體和模板都能對齊。在 Claude Cowork 協作環境中，它甚至能進行自主多任務處理。

另一方面，Anthropic 順勢在 Claude Code 中推出了實驗性的 Agent Teams 功能，讓普通開發者也能體驗這種「指揮千軍萬馬」的感覺：

角色分工：你可以指定一個 Claude Session 擔任 Team Lead（組長），它不干臟活累活，專門負責拆解任務、分配工單、合并代碼；其他的 Session 則是隊友（Teammates），各自領任務去干。
獨立作戰：每個隊友都有獨立的上下文窗口（不用擔心 Token 爆炸），它們甚至能背著你互相發消息（Inter-agent messaging），討論技術細節，最后只把結果匯報給組長。
并行賽馬：這東西有什么用？想象一下查一個頑固 Bug，你可以生成 5 個 Agent，分別驗證 5 種不同的假設，像「賽馬」一樣并行排雷；或者在 Code Review 時，讓一個隊友扮「安全專家」查漏洞，一個扮「架構師」看性能，互不干擾。

為了展示 Opus 4.6 的極限，Anthropic 的研究員 Nicholas Carlini 搞了個瘋狂的實驗：Agent Teams（智能體團隊）。

他沒有親自寫代碼，而是扔了 2 萬美元的 API 額度，讓 16 個 Claude Opus 4.6 組成一個「全自動軟件開發團隊」。

結果在短短兩周內，這群 AI 自主進行了 2000 多個編程會話，從零手寫了一個 10 萬行代碼的 C 語言編譯器（基于 Rust）。

這個 AI 寫的編譯器，還成功編譯了 Linux 6.9 內核（涵蓋 x86、ARM 和 RISC-V 架構），甚至跑通了 Doom 游戲。

雖然它還不夠完美（比如生成的代碼效率不如 GCC），但這個案例也表明我們不再是和 AI 一起編程，而是看著一個 AI 團隊自主協作、查錯、推進項目。

此外，它還學會了 Adaptive Thinking（自適應推理），能根據難度自己決定「想多久」。加上新增的「智能強度」控制，你可以在 Low 到 Max 四檔之間切換。

定價方面，Anthropic 這次很良心，維持在每百萬 Token $5/$25 的基礎定價。看來是為了搶占企業級市場，鐵了心要和 OpenAI 卷到底。

一個是激進天才，一個是靠譜老牛

知名 AI 評測人 Dan Shipper 在第一時間搞了個「盲測」（Vibe Check），他的評價非常精準：

Claude Opus 4.6 是「高上限，高方差」（High Ceiling, High Variance）。

它像是一個才華橫溢但偶爾跳脫的天才。在測試中，它直接解決了一個讓 iOS 團隊卡了兩個月的功能難題；在 LFG Benchmark 中拿到了 9.25/10 的高分。

但它偶爾也會「過度自信」，一本正經地胡說八道。如果你需要突破性的靈感，選它。

GPT-5.3-Codex 是「高可靠，低方差」（High Reliability, Low Variance）。

它像是一個經驗豐富、絕不掉鏈子的資深工程師。推理速度提升 25%，幾乎不犯低級錯誤，穩健得讓人心安。

雖然在創造性任務上略遜一籌（LFG 得分 7.5/10），但在日常的 Coding 和運維任務中，它是最高效的老黃牛。如果你需要穩定交付，選它。

時間步入 2026 年，我們的角色開始發生變化。

在這個時間節點，對于普通用戶而言，最大的變化莫過于此：Prompt Engineering（提示詞工程）的重要性正在下降，而 Agent Management（智能體管理）的能力開始浮出水面。

當 ChatGPT 可以自主修 Bug 甚至操作你的終端，當 Claude 可以一次性吞吐 100 萬字并精準定位細節時，我們不再需要像教小學生一樣，把指令拆解得碎碎念。

我們需要做的，是學會如何以「管理者」的身份，去定義目標、審核結果、以及——決定在什么時候，把什么任務交給哪位「員工」。

這就是 2026 年的新職場：你的團隊里混入了一群硅基天才，而你是唯一的碳基老板。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

人氣火爆！江蘇無錫一景區發布限流公告

現代快報 2026-02-19 22:42:05
589 跟貼 589
哈爾濱冰雪大世界：正式閉園

大風新聞 2026-02-21 20:36:03
1869 跟貼 1869

廣東官宣：全省大會將于初八召開

政知新媒體 2026-02-22 11:21:20
52 跟貼 52

大超市爆改文商旅綜合體，“金陵長樂坊”開市首日人氣爆棚

現代快報 2026-02-19 22:53:05
602 跟貼 602
三亞至深圳最高票價達14460元

第一財經資訊 2026-02-22 12:34:38
1054 跟貼 1054

利好！000988，AI高速光模塊訂單排到四季度

證券時報 2026-02-22 11:31:03
47 跟貼 47

韓媒：韓國唯一領先戰略技術被中國超越

環球網資訊 2026-02-22 14:52:14
127 跟貼 127
凌晨3點就上山，有人爬5小時才喝到山頂咖啡！杭州“天下第一財神廟”勸返游客：回家吧

環球網資訊 2026-02-22 08:06:08
387 跟貼 387

美國載人繞月任務又推遲了

每日經濟新聞 2026-02-22 08:04:05
435 跟貼 435
WTT新加坡大滿貫正賽今日開打國乒8人出戰賽程公布

大象新聞 2026-02-22 06:56:14
136 跟貼 136
暴漲！有相機價格翻10倍，根本搶不到，杭州姑娘傻眼，馬上翻出家里老古董

環球網資訊 2026-02-22 16:48:12
3 跟貼 3
趙心童闖入斯諾克球員錦標賽決賽

環球網資訊 2026-02-22 08:28:08
174 跟貼 174
monies巴黎旗艦店員工：王菲同款水滴耳環官網和巴黎門店庫存已空，她去年在春晚戴的“蝦片耳環”也沒貨了

大風新聞 2026-02-22 12:06:17
91 跟貼 91
送別 | 6位消防員！英雄走好！

天津廣播 2026-02-22 13:07:52
63 跟貼 63
女子下車接電話，將900克金飾遺落在火車上，價值近135萬元，1小時找回

上觀新聞 2026-02-22 09:10:07
107 跟貼 107
男子參加“王婆說媒”，自稱“在政府機關上班”、有豪車及多套房，官方回應

上觀新聞 2026-02-22 14:29:06
0 跟貼 0
蘇翊鳴將擔任米蘭冬奧會閉幕式中國代表團旗手

央視新聞客戶端 2026-02-22 07:17:58
66 跟貼 66
全到莆田過大年：由文化現象到現象級文化IP

中國新聞周刊 2026-02-22 19:48:20
4 跟貼 4
熱解讀｜“躍馬揚鞭”開新局

海外網 2026-02-22 14:43:03
45 跟貼 45
臺北一男子連開4槍！多次變裝逃離，警方正追查

揚子晚報 2026-02-22 23:20:24
0 跟貼 0
尷尬！這家商場男廁“無遮擋” 市民直呼隱私難保障

上觀新聞 2026-02-22 23:29:14
0 跟貼 0
“我家里有賓利保時捷，房子很多！”男子上臺相親惹禍，通報來了

一絲不茍的法律人 2026-02-22 23:22:44
0 跟貼 0
反轉！媽祖換人新進展: 官方通報還原事發經過，沒有所謂的許老板

離離言幾許 2026-02-22 23:38:25
0 跟貼 0
高速春節堵車一老板原地賣甘蔗，目擊者發聲：10元一根，不稱重，選好就走

環球網資訊 2026-02-22 12:21:07
0 跟貼 0
一路飄紅！第一批返程的人已堵哭……最新提醒→

重慶晨報 2026-02-22 16:18:51
0 跟貼 0

40歲保姆：拿著雇主的高工資提供特殊服務，老公得知后和我離婚了

40歲保姆：拿著雇主的高工資提供特殊服務，老公得知后和我離婚了

孢木情感

2026-02-21 12:14:58

TVB花旦曬近況疑似真空上陣！遭網民催婚，已兩年無新作品

TVB花旦曬近況疑似真空上陣！遭網民催婚，已兩年無新作品

阿嬍體育評論

2026-02-20 10:15:37

劉濤演媽祖擲圣杯3次獲允，男孩8次未過引福建老板集體放話

劉濤演媽祖擲圣杯3次獲允，男孩8次未過引福建老板集體放話

懶散的雅兒

2026-02-21 20:19:58

“釣帝”黑大爺去世了，兒子：父親釣魚50年，釣到最大的魚四五斤

“釣帝”黑大爺去世了，兒子：父親釣魚50年，釣到最大的魚四五斤

漢史趣聞

2026-02-22 19:30:43

一個人變富的開始：少相信人，多相信書

一個人變富的開始：少相信人，多相信書

洞見

2026-02-21 21:29:36

殲10C獲天價訂單，印媒罕見表態：優于西方戰機

殲10C獲天價訂單，印媒罕見表態：優于西方戰機

觀察者小海風

2026-02-22 06:34:03

辭去央視鐵飯碗，帶著兒子嫁給張譯，20年過去，才知道她有多明智

辭去央視鐵飯碗，帶著兒子嫁給張譯，20年過去，才知道她有多明智

阿廢冷眼觀察所

2026-02-21 13:48:22

蘇翊鳴日本籍教練：中國隊曾高薪邀我做專屬教練我花30秒拒絕了

蘇翊鳴日本籍教練：中國隊曾高薪邀我做專屬教練我花30秒拒絕了

風過鄉

2026-02-22 09:48:04

在剛剛！中國男籃14人名單出爐！杜鋒3愛徒在列，6后衛6鋒線2中鋒

在剛剛！中國男籃14人名單出爐！杜鋒3愛徒在列，6后衛6鋒線2中鋒

老吳說體育

2026-02-22 21:34:14

比謝霆鋒還顛！張柏芝大兒子戀情疑曝光，46歲大媽、辣妹都不放過

比謝霆鋒還顛！張柏芝大兒子戀情疑曝光，46歲大媽、辣妹都不放過

查爾菲的筆記

2026-02-09 15:02:01

突傳利好！000988：AI高速光模塊產線24小時滿負荷運轉，訂單排到四季度！

突傳利好！000988：AI高速光模塊產線24小時滿負荷運轉，訂單排到四季度！

證券時報e公司

2026-02-22 12:28:50

老板娘問我她格局大不大，我該怎么回答？

老板娘問我她格局大不大，我該怎么回答？

太急張三瘋

2026-02-22 18:40:04

巴恩斯利青訓主管：徐彬態度極佳，是位令人難以置信的運動員

巴恩斯利青訓主管：徐彬態度極佳，是位令人難以置信的運動員

懂球帝

2026-02-22 15:24:29

2032奧運會舉辦地確定，結果意外改變全球奧運格局

2032奧運會舉辦地確定，結果意外改變全球奧運格局

余憁搞笑段子

2026-02-02 16:48:20

李健：不生孩子，不買房，不用微信，討厭早睡早起，一天吃一頓飯

李健：不生孩子，不買房，不用微信，討厭早睡早起，一天吃一頓飯

章眽八卦

2026-01-30 12:52:04

白銀脫韁了

環球老虎財經

2026-02-22 10:16:27

56歲王菲沒想到，春晚才結束3天，當眾“哽咽”的謝霆鋒又圈粉了

56歲王菲沒想到，春晚才結束3天，當眾“哽咽”的謝霆鋒又圈粉了

小椰的奶奶

2026-02-22 23:10:36

你有知道哪些炸裂的秘密？網友：我有個秘密說出來肯定大家要笑死

你有知道哪些炸裂的秘密？網友：我有個秘密說出來肯定大家要笑死

帶你感受人間冷暖

2026-01-29 00:10:05

清朝人口暴漲之謎：從7千萬迅速增長到4億，究竟發生了什么？

清朝人口暴漲之謎：從7千萬迅速增長到4億，究竟發生了什么？

老臉科普君

2026-02-14 11:59:15

印度91歲僧人78年不吃不喝？軍方在其房間裝上監控，最終發現真相

印度91歲僧人78年不吃不喝？軍方在其房間裝上監控，最終發現真相

談史論天地

2026-02-22 06:31:28

消費科技第一媒體

38445文章數 2600951關注度

往期回顧全部

科技要聞

馬斯克：星艦每年將發射超過10000顆衛星

頭條要聞

男子持霰彈槍燃燒罐闖特朗普私宅被擊斃細節披露

頭條要聞

男子持霰彈槍燃燒罐闖特朗普私宅被擊斃細節披露

體育要聞

谷愛凌：6次參賽6次奪牌我對自己非常自豪

娛樂要聞

裴世矩養侄為刃看懂兩次放行裴行儼！

財經要聞

特朗普新加征關稅稅率從10%提升至15%

汽車要聞

續航1810km！smart精靈#6 EHD超級電混2026年上市

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

親子

數碼

教育

手機

《GTA6》的第二天發售？《寶可夢》新作爆料來了！

親子要聞

萌娃看見阿姨的大肚子竟這樣說，著急的樣子萌化了

數碼要聞

古爾曼：蘋果3月2 - 4日發布“至少五款產品”

教育要聞

孩子不設防，一切危險都有可能發生！

手機要聞

炸場！iQOO Z11X通過雙認證，9000mAh續航碾壓千元機

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<tr id="c18f3"></tr>

<button id="c18f3"></button>

<pre id="c18f3"><fieldset id="c18f3"><style id="c18f3"></style></fieldset></pre>