<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛,ChatGPT 和 Claude 同時大更新,不會給 AI 當老板的打工人要被淘汰

      0
      分享至

      就在剛剛,硅谷 AI 圈上演了一出「火星撞地球」。

      OpenAI 和 Anthropic 像約好了一樣,同時甩出了自家的重磅更新:Claude Opus 4.6 和 GPT-5.3-Codex。

      如果說昨晚之前,我們還在討論「怎么寫好 Prompt 輔助工作」;那么今天凌晨,我們可能被迫要學會「如何作為老板去管理 AI 員工」。


      AI 造 AI,順便接管你的電腦

      就在昨天,Sam Altman 剛在 X 平臺上凡爾賽了一把 Codex 的「百萬活躍用戶」里程碑。短短一天后,OpenAI 再次乘勝追擊,扔出王炸——GPT-5.3-Codex。

      技術文檔里藏著一句極具分量的話:「這是我們第一個在創造自己的過程中,發揮了關鍵作用的模型。」

      說人話就是:AI 已經學會了自己寫代碼、自己找 Bug,甚至開始自己訓練下一代的 AI 了。這種自我進化能力,也直接體現在了一連串跑分數據上。


      還記得那個模擬人類操作電腦的 OSWorld-Verified 基準測試嗎?前代模型只有 38.2% 的準確率,連及格線都夠不上。

      但這次,GPT-5.3-Codex 直接跳漲到了 64.7%!


      要知道,人類的平均水平也就 72%。這意味著,AI 距離像你一樣熟練地甩鼠標、切屏、操作軟件,只剩下一層窗戶紙的距離。

      而在 Terminal-Bench 2.0(命令行操作)中,它更是拿下了 77.3% 的高分,把 GPT-5.2(62.2%)遠遠甩在身后。


      知名 SWE-Bench Pro 基準測試覆蓋四種編程語言,不僅抗污染,還全是真實世界的硬核工程難題。

      GPT-5.3-Codex 在這里不僅拿下了 SOTA(最高水平),而且用的 Token 比以往任何模型都少。這意味著什么?意味著它不僅干活猛,解決問題的路徑還比人類更短、更省錢。

      OpenAI 甚至展示了它獨立構建的能力:

      在幾天內,它從零構建了一款包含多張地圖的賽車游戲 v2,順手還搞定了一款管理氧氣系統的深海潛水游戲。


      最讓我印象深刻的是 GPT-5.3-Codex 對模糊意圖的理解。

      在構建「Quiet KPI」落地頁時,它自動把「年度計劃」換算成了「打折后的月付價格」,甚至還貼心地自動補充了用戶評價輪播——這一切,都不需要你下指令。


      OpenAI 的野心已經寫在臉上了:以前微軟常說 AI 將會成為人類的副駕駛(Copilot),但現在 AI 更想做那個能掌控方向盤、甚至能自己修車的司機。

      對了,還有一個有趣的細節。

      此前外界盛傳 OpenAI 對英偉達的 AI 芯片頗有微詞,但這次官方博客特地強調:GPT-5.3-Codex 的設計、訓練和部署都在 NVIDIA GB200 NVL72 系統上完成。

      這一波高情商的「感謝英偉達」,屬實是給足了黃仁勛面子。


      告別「金魚記憶」Claude 迎來絕地反擊

      在 GPT-5.3-Codex 發布的前后腳,Anthropic 也端出了自己的春節大禮包。

      壞消息是,大家期待的 Claude「中杯」Sonnet 模型沒有更新;但好消息是,Anthropic 直接端出了「超大杯」—— Claude Opus 4.6。

      相比于 OpenAI 在「行動力」上的激進,Anthropic 今天發布的 Claude Opus 4.6 則是在「思考力」和「可用性」上死磕。


      很多企業用戶都有一個名為 Context Rot(上下文腐蝕)的痛點:號稱支持 200k 上下文,但塞進去的數據一多,AI 就開始顧頭不顧尾。

      這次,Claude Opus 4.6 拿出的數據簡直是「降維打擊」。

      在 MRCR v2(長文本大海撈針)測試中,Claude Opus 4.6 的召回率高達 76%。

      作為對比,上一代 Sonnet 4.5 只有慘不忍睹的 18.5%。從某種程度上說,這是一個從基本不可用到「高可靠」的質變。

      這是 Claude Opus 4.6 首次引入了真正可用的 1M 上下文窗口。



      這意味著什么?意味著你可以把幾百頁的財報、幾十萬字的代碼庫直接扔給它,它不僅能讀完,還能精準地告訴你第 342 頁腳注里的那個數字有問題。

      更讓打工人眼前一亮的是它的生產力功能。

      一方面,Anthropic 這回直接把 Claude 塞進了 Excel 和 PowerPoint。它能根據 Excel 數據直接生成 PPT,不僅保留排版風格,連字體和模板都能對齊。在 Claude Cowork 協作環境中,它甚至能進行自主多任務處理。

      另一方面,Anthropic 順勢在 Claude Code 中推出了實驗性的 Agent Teams 功能,讓普通開發者也能體驗這種「指揮千軍萬馬」的感覺:

      • 角色分工:你可以指定一個 Claude Session 擔任 Team Lead(組長),它不干臟活累活,專門負責拆解任務、分配工單、合并代碼;其他的 Session 則是隊友(Teammates),各自領任務去干。
      • 獨立作戰:每個隊友都有獨立的上下文窗口(不用擔心 Token 爆炸),它們甚至能背著你互相發消息(Inter-agent messaging),討論技術細節,最后只把結果匯報給組長。
      • 并行賽馬:這東西有什么用?想象一下查一個頑固 Bug,你可以生成 5 個 Agent,分別驗證 5 種不同的假設,像「賽馬」一樣并行排雷;或者在 Code Review 時,讓一個隊友扮「安全專家」查漏洞,一個扮「架構師」看性能,互不干擾。

      為了展示 Opus 4.6 的極限,Anthropic 的研究員 Nicholas Carlini 搞了個瘋狂的實驗:Agent Teams(智能體團隊)。

      他沒有親自寫代碼,而是扔了 2 萬美元 的 API 額度,讓 16 個 Claude Opus 4.6 組成一個「全自動軟件開發團隊」。

      結果在短短兩周內,這群 AI 自主進行了 2000 多個編程會話,從零手寫了一個 10 萬行代碼的 C 語言編譯器(基于 Rust)。


      這個 AI 寫的編譯器,還成功編譯了 Linux 6.9 內核(涵蓋 x86、ARM 和 RISC-V 架構),甚至跑通了 Doom 游戲。

      雖然它還不夠完美(比如生成的代碼效率不如 GCC),但這個案例也表明我們不再是和 AI 一起編程,而是看著一個 AI 團隊自主協作、查錯、推進項目。

      此外,它還學會了 Adaptive Thinking(自適應推理),能根據難度自己決定「想多久」。加上新增的「智能強度」控制,你可以在 Low 到 Max 四檔之間切換。

      定價方面,Anthropic 這次很良心,維持在每百萬 Token $5/$25 的基礎定價。看來是為了搶占企業級市場,鐵了心要和 OpenAI 卷到底。

      一個是激進天才,一個是靠譜老牛

      知名 AI 評測人 Dan Shipper 在第一時間搞了個「盲測」(Vibe Check),他的評價非常精準:

      Claude Opus 4.6 是「高上限,高方差」(High Ceiling, High Variance)。

      它像是一個才華橫溢但偶爾跳脫的天才。在測試中,它直接解決了一個讓 iOS 團隊卡了兩個月的功能難題;在 LFG Benchmark 中拿到了 9.25/10 的高分。

      但它偶爾也會「過度自信」,一本正經地胡說八道。如果你需要突破性的靈感,選它。

      GPT-5.3-Codex 是「高可靠,低方差」(High Reliability, Low Variance)。

      它像是一個經驗豐富、絕不掉鏈子的資深工程師。推理速度提升 25%,幾乎不犯低級錯誤,穩健得讓人心安。

      雖然在創造性任務上略遜一籌(LFG 得分 7.5/10),但在日常的 Coding 和運維任務中,它是最高效的老黃牛。如果你需要穩定交付,選它。


      時間步入 2026 年,我們的角色開始發生變化。

      在這個時間節點,對于普通用戶而言,最大的變化莫過于此:Prompt Engineering(提示詞工程)的重要性正在下降,而 Agent Management(智能體管理)的能力開始浮出水面。

      當 ChatGPT 可以自主修 Bug 甚至操作你的終端,當 Claude 可以一次性吞吐 100 萬字并精準定位細節時,我們不再需要像教小學生一樣,把指令拆解得碎碎念。

      我們需要做的,是學會如何以「管理者」的身份,去定義目標、審核結果、以及——決定在什么時候,把什么任務交給哪位「員工」。

      這就是 2026 年的新職場:你的團隊里混入了一群硅基天才,而你是唯一的碳基老板。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      40歲保姆:拿著雇主的高工資提供特殊服務,老公得知后和我離婚了

      40歲保姆:拿著雇主的高工資提供特殊服務,老公得知后和我離婚了

      孢木情感
      2026-02-21 12:14:58
      TVB花旦曬近況疑似真空上陣!遭網民催婚,已兩年無新作品

      TVB花旦曬近況疑似真空上陣!遭網民催婚,已兩年無新作品

      阿嬍體育評論
      2026-02-20 10:15:37
      劉濤演媽祖擲圣杯3次獲允,男孩8次未過引福建老板集體放話

      劉濤演媽祖擲圣杯3次獲允,男孩8次未過引福建老板集體放話

      懶散的雅兒
      2026-02-21 20:19:58
      “釣帝”黑大爺去世了,兒子:父親釣魚50年,釣到最大的魚四五斤

      “釣帝”黑大爺去世了,兒子:父親釣魚50年,釣到最大的魚四五斤

      漢史趣聞
      2026-02-22 19:30:43
      一個人變富的開始:少相信人,多相信書

      一個人變富的開始:少相信人,多相信書

      洞見
      2026-02-21 21:29:36
      殲10C獲天價訂單,印媒罕見表態:優于西方戰機

      殲10C獲天價訂單,印媒罕見表態:優于西方戰機

      觀察者小海風
      2026-02-22 06:34:03
      辭去央視鐵飯碗,帶著兒子嫁給張譯,20年過去,才知道她有多明智

      辭去央視鐵飯碗,帶著兒子嫁給張譯,20年過去,才知道她有多明智

      阿廢冷眼觀察所
      2026-02-21 13:48:22
      蘇翊鳴日本籍教練:中國隊曾高薪邀我做專屬教練 我花30秒拒絕了

      蘇翊鳴日本籍教練:中國隊曾高薪邀我做專屬教練 我花30秒拒絕了

      風過鄉
      2026-02-22 09:48:04
      在剛剛!中國男籃14人名單出爐!杜鋒3愛徒在列,6后衛6鋒線2中鋒

      在剛剛!中國男籃14人名單出爐!杜鋒3愛徒在列,6后衛6鋒線2中鋒

      老吳說體育
      2026-02-22 21:34:14
      比謝霆鋒還顛!張柏芝大兒子戀情疑曝光,46歲大媽、辣妹都不放過

      比謝霆鋒還顛!張柏芝大兒子戀情疑曝光,46歲大媽、辣妹都不放過

      查爾菲的筆記
      2026-02-09 15:02:01
      突傳利好!000988:AI高速光模塊產線24小時滿負荷運轉,訂單排到四季度!

      突傳利好!000988:AI高速光模塊產線24小時滿負荷運轉,訂單排到四季度!

      證券時報e公司
      2026-02-22 12:28:50
      老板娘問我她格局大不大,我該怎么回答?

      老板娘問我她格局大不大,我該怎么回答?

      太急張三瘋
      2026-02-22 18:40:04
      巴恩斯利青訓主管:徐彬態度極佳,是位令人難以置信的運動員

      巴恩斯利青訓主管:徐彬態度極佳,是位令人難以置信的運動員

      懂球帝
      2026-02-22 15:24:29
      2032奧運會舉辦地確定,結果意外改變全球奧運格局

      2032奧運會舉辦地確定,結果意外改變全球奧運格局

      余憁搞笑段子
      2026-02-02 16:48:20
      李健:不生孩子,不買房,不用微信,討厭早睡早起,一天吃一頓飯

      李健:不生孩子,不買房,不用微信,討厭早睡早起,一天吃一頓飯

      章眽八卦
      2026-01-30 12:52:04
      白銀脫韁了

      白銀脫韁了

      環球老虎財經
      2026-02-22 10:16:27
      56歲王菲沒想到,春晚才結束3天,當眾“哽咽”的謝霆鋒又圈粉了

      56歲王菲沒想到,春晚才結束3天,當眾“哽咽”的謝霆鋒又圈粉了

      小椰的奶奶
      2026-02-22 23:10:36
      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      帶你感受人間冷暖
      2026-01-29 00:10:05
      清朝人口暴漲之謎:從7千萬迅速增長到4億,究竟發生了什么?

      清朝人口暴漲之謎:從7千萬迅速增長到4億,究竟發生了什么?

      老臉科普君
      2026-02-14 11:59:15
      印度91歲僧人78年不吃不喝?軍方在其房間裝上監控,最終發現真相

      印度91歲僧人78年不吃不喝?軍方在其房間裝上監控,最終發現真相

      談史論天地
      2026-02-22 06:31:28
      2026-02-22 23:51:00
      愛范兒 incentive-icons
      愛范兒
      消費科技第一媒體
      38445文章數 2600951關注度
      往期回顧 全部

      科技要聞

      馬斯克:星艦每年將發射超過10000顆衛星

      頭條要聞

      男子持霰彈槍燃燒罐闖特朗普私宅被擊斃 細節披露

      頭條要聞

      男子持霰彈槍燃燒罐闖特朗普私宅被擊斃 細節披露

      體育要聞

      谷愛凌:6次參賽6次奪牌 我對自己非常自豪

      娛樂要聞

      裴世矩養侄為刃 看懂兩次放行裴行儼!

      財經要聞

      特朗普新加征關稅稅率從10%提升至15%

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      游戲
      親子
      數碼
      教育
      手機

      《GTA6》的第二天發售?《寶可夢》新作爆料來了!

      親子要聞

      萌娃看見阿姨的大肚子竟這樣說,著急的樣子萌化了

      數碼要聞

      古爾曼:蘋果3月2 - 4日發布“至少五款產品”

      教育要聞

      孩子不設防,一切危險都有可能發生!

      手機要聞

      炸場!iQOO Z11X通過雙認證,9000mAh續航碾壓千元機

      無障礙瀏覽 進入關懷版