網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

過了個(gè)年，AI 圈變天了？但沒人告訴你為什么

2026-02-25 12:29:02　來源: 歸藏的AI工具箱

北京舉報(bào)

分享至

最近看了很多文章。都在說我們已經(jīng)邁過了奇點(diǎn)，Agent 時(shí)代來了。

海外一位做了六年 AI 創(chuàng)業(yè)的 Matt Shumer 寫了篇長文叫《Something Big Is Happening》快一億曝光。

他說自己一直給家人朋友講"禮貌版本"，因?yàn)檎\實(shí)版本聽起來像瘋了。但他覺得不能再瞞著了。

Anthropic CEO Dario Amodei 發(fā)了兩萬字的《The Adolescence of Technology》。

把現(xiàn)在這個(gè)階段比作人類文明的"青春期"。

我的朋友們也在寫，"賽博禪心"說我們可能已經(jīng)邁過了文明的奇點(diǎn)，"有機(jī)大橘子"說互聯(lián)網(wǎng)已死、Agent 永生。

我看完這些文章之后的感受是：

他們都在告訴你"變化已經(jīng)發(fā)生"，但沒有人把"變化具體是什么"講的特別清楚。

模型不就是那些模型嗎？產(chǎn)品不就是那些產(chǎn)品嗎？為什么突然間就不一樣了？

我猜很多人看完那些文章，焦慮了一陣，然后該干嘛干嘛。

因?yàn)槟悴恢谰唧w發(fā)生了什么，就沒法判斷它跟你有什么關(guān)系。

這篇文章不是來制造焦慮的。焦慮沒用。

我想做的事很簡單：把 2026 年初 AI 領(lǐng)域到底發(fā)生了哪些變化，一層一層拆給你看。然后你自己判斷要不要跟進(jìn)。

在聊技術(shù)之前，先說一個(gè)讓我不安的事

我自己用這套新的 Agent 體系，一個(gè)人花了一周寫出了一個(gè)完整的產(chǎn)品，覆蓋多個(gè)平臺，GitHub 上拿了 2000 Star。放在以前，這個(gè)活需要大廠一個(gè)小組干一個(gè)月。

但同時(shí)，相當(dāng)多的人連 AI 是什么都不知道。

不是 2026 年的 AI，他們連 2024 年的 AI 都沒怎么用過。

而且這不只是所謂"底層人群"的問題。

大廠里年薪幾十萬上百萬的白領(lǐng)，在體系里當(dāng)了多年螺絲釘?shù)娜耍幘称鋵?shí)一樣危險(xiǎn)。

他們每天做的事——寫報(bào)告、做 PPT、整理數(shù)據(jù)、協(xié)調(diào)溝通、走審批流程。

本質(zhì)上就是把信息從一種格式搬到另一種格式。

這些活 Agent 干得又快又好。

已經(jīng)有一批人意識到了，快速跟進(jìn)，生產(chǎn)力短時(shí)間內(nèi)拉開了差距。

管理層看得很清楚：同樣的任務(wù)，會用 Agent 的人一天搞定，不會用的人一周。

在現(xiàn)在的經(jīng)濟(jì)環(huán)境，這個(gè)對比意味著什么，不用多說。

而且這個(gè)差距會自我強(qiáng)化。用得越多，理解越深，用得越好，差距越大。

所以我想把具體的變化拆清楚，讓你知道到底發(fā)生了什么，然后自己決定要不要跟進(jìn)。

2026 年初到底發(fā)生了什么

2025 年你用 AI 的方式大概是這樣的：

你 → 打開對話框 → 問一個(gè)問題 → AI 回答 → 你自己判斷對不對，自己去執(zhí)行

2026 年初變成了這樣：

你 → 描述一個(gè)意圖 → Agent 自己拆解任務(wù)，調(diào)度多個(gè)子 Agent → 每個(gè) Agent 連接不同的工具和數(shù)據(jù) → 并行探索多條路徑 → 自己判斷質(zhì)量 → 交付成品

AI 從一個(gè)你問它答的工具，變成了能替你干活的勞動力。

這個(gè)變化可以拆成四層來理解：大腦、手腳、組織、進(jìn)化。

第一層：大腦變了

2026 年 2 月 5 日，Anthropic 和 OpenAI 同一天發(fā)布了新模型：Claude Opus 4.6 和 GPT-5.3 Codex。

這次發(fā)布跟以往的版本更新不太一樣。幾個(gè)具體的變化：

編程能力跳了一個(gè)臺階：

GPT-5.3 Codex 在多個(gè)權(quán)威編程測試上刷新了紀(jì)錄，而且消耗的資源比之前的模型更少。Opus 4.6 也是，在大型代碼庫里跑得更穩(wěn)，還能發(fā)現(xiàn)自己寫的 bug 然后改掉。

開始有"判斷力"了：

以前的模型調(diào)用工具像照著說明書按按鈕，你告訴它用什么它才用什么。

現(xiàn)在它能自己判斷該用什么工具、什么時(shí)候用、怎么組合著用。

Matt Shumer 用了兩個(gè)詞形容這種感覺：judgment（判斷力）和 taste（品味）。

能連續(xù)工作好幾個(gè)小時(shí)了：

METR（一個(gè)專門追蹤 AI 能力的研究機(jī)構(gòu)）一直在測一個(gè)指標(biāo)：AI 能獨(dú)立完成多長時(shí)間的專家級任務(wù)。

一年前大概是 10 分鐘，后來變成 1 小時(shí)，再后來幾個(gè)小時(shí)。

到 2025 年 11 月已經(jīng)能完成專家需要將近 5 小時(shí)的任務(wù)。這個(gè)數(shù)字大概每 4 到 7 個(gè)月翻一倍。

2 月 5 日發(fā)布的新模型還沒被測進(jìn)去。

Opus 4.6 還有一個(gè)新東西：100 萬 token 的上下文窗口。

長上下文窗口越來越普遍，DeepSeek 前幾天也更新了 100 萬上下文。

名詞解釋：Token 和上下文窗口 Token 是 AI 處理信息的基本單位，大約 1 個(gè)中文字等于 1 到 2 個(gè) token。上下文窗口就是 AI 一次能"看到"多少信息。100 萬 token 意味著它能把一整個(gè)大型項(xiàng)目的代碼和文檔全部裝進(jìn)腦子里，不會做到一半忘了前面在干什么。

AI 開始參與造自己了：

這個(gè)可能是最值得注意的變化。GPT-5.3 Codex 是第一個(gè)參與了自身創(chuàng)建過程的模型。

OpenAI 在技術(shù)文檔里寫了：Codex 團(tuán)隊(duì)用它的早期版本來調(diào)試訓(xùn)練過程、管理部署、診斷測試結(jié)果。

Amodei 也說 AI 現(xiàn)在在寫 Anthropic "大部分的代碼"，這個(gè)反饋循環(huán)在"逐月加速"。

更聰明的 AI 寫出更好的代碼，造出更聰明的 AI，再寫出更好的代碼。這個(gè)循環(huán)已經(jīng)轉(zhuǎn)起來了。

這一層帶來了什么變化

Matt Shumer 描述了他現(xiàn)在的工作方式：

告訴 AI 想要什么，離開電腦四個(gè)小時(shí)，回來發(fā)現(xiàn)活干完了。

AI 自己寫代碼、自己打開應(yīng)用測試、發(fā)現(xiàn)問題自己改，改到滿意了才交給他。

交付的是成品，不是需要他再花幾個(gè)小時(shí)修的草稿。

第二層：手腳長出來了

2025 年的 AI 也挺聰明的，但它被困在一個(gè)對話框里。你問它問題它能答，但它沒法替你去做事。

2026 年這個(gè)限制被打破了。

Agent 跑在你自己的電腦上

以 Claude Code 為代表的新一代 Agent 跑在你的本地電腦上。這個(gè)變化比聽起來重要得多。

名詞解釋：Agent Agent 不是聊天機(jī)器人。你給它一個(gè)目標(biāo)，它自己決定怎么做、用什么工具、做完了自己檢查質(zhì)量。Claude Code 是 Anthropic 做的編程 Agent，跑在你電腦的終端里。

以前你的數(shù)據(jù)跟著產(chǎn)品走。筆記鎖在 Notion 里，文檔鎖在飛書里，聊天記錄鎖在 ChatGPT 里。

換一個(gè)產(chǎn)品，之前積累的東西就斷了。你被綁在某個(gè)生態(tài)里，不是因?yàn)樗詈茫且驗(yàn)槟愕臄?shù)據(jù)在那。

現(xiàn)在反過來了。

你的電腦本來就存著你所有的代碼、文檔、設(shè)計(jì)稿、會議記錄。

Agent 直接讀這些東西，不需要你上傳或者復(fù)制粘貼。

而且這些數(shù)據(jù)不跟任何模型綁定。

今天用 Opus 4.6，明天覺得 GPT-6 更好就切過去，你的文件都還在。

上下文是你的，不是廠商的。

MCP：讓 Agent 連上外面的世界

Agent 跑在本地了，但它怎么連接你電腦之外的服務(wù)？

名詞解釋：MCP（Model Context Protocol） Anthropic 做的一個(gè)開源協(xié)議。以前 AI 要連一個(gè)外部服務(wù)（比如 GitHub、Slack、數(shù)據(jù)庫），得專門寫一套對接代碼。10 個(gè)服務(wù)就寫 10 套。MCP 把這變成了即插即用：每個(gè)服務(wù)做一個(gè)標(biāo)準(zhǔn)接口，任何 AI 都能直接用。類似 USB-C，一個(gè)口通吃所有設(shè)備。

現(xiàn)在已經(jīng)有非常多的客戶端支持 MCP，你常見的服務(wù)都有（GitHub、Figma、Jira、Slack、Stripe 等等）。

Anthropic、OpenAI、Google 三家在 2025 年底聯(lián)合推這個(gè)標(biāo)準(zhǔn)。

平時(shí)互相競爭的三家在這件事上合作了，說明大家都認(rèn)為這是必須統(tǒng)一的基礎(chǔ)設(shè)施。

你散落在飛書、Notion、各種云服務(wù)里的信息，通過 MCP 也能被 Agent 拉回來。

本地文件提供最核心的上下文，MCP 把剩下的補(bǔ)上。

Skills：可以共享的技能包

名詞解釋：Skills 預(yù)先定義好的能力模塊，Agent 按需加載。比如一個(gè)"前端開發(fā)"Skill 里有 React 最佳實(shí)踐和測試方法，一個(gè)"數(shù)據(jù)分析"Skill 里有 SQL 查詢模式和可視化方法。這些 Skill 可以由社區(qū)創(chuàng)建和共享。

Skills 改變的是 Agent 獲取能力的方式。

以前你想讓 AI 幫你做一件專業(yè)的事，你得自己寫一大段提示詞，把背景、規(guī)范、注意事項(xiàng)全塞進(jìn)去。

每次都得重新寫，寫得不好效果就差。

現(xiàn)在有人把這些專業(yè)知識打包成了 Skill。

你的 Agent 需要做前端開發(fā)，加載一個(gè)前端 Skill 就行，里面的最佳實(shí)踐、代碼規(guī)范、測試方法都配好了。

需要做數(shù)據(jù)分析，換一個(gè) Skill。就像給員工發(fā)了一本針對性的操作手冊，只不過這個(gè)手冊是即插即用的。

更重要的是，Skills 可以由社區(qū)創(chuàng)建和共享。一個(gè)資深工程師把自己十年的經(jīng)驗(yàn)封裝成 Skill，全世界的 Agent 都能用。你不需要自己是專家，你的 Agent 可以隨時(shí)變成專家。

這也意味著 Agent 的能力上限不再由開發(fā)它的公司決定，而是由整個(gè)社區(qū)決定。

社區(qū)越活躍，可用的 Skill 越多，每個(gè)人的 Agent 就越強(qiáng)。

Agent 開始認(rèn)識你了

前面說的這些能力——本地運(yùn)行、MCP 連接、Skills 加載——有一個(gè)共同的問題：

每次對話結(jié)束，Agent 就忘了你是誰。

Claude Code 最先解決了一部分。

它在項(xiàng)目根目錄下放了一個(gè) CLAUDE.md，你寫上項(xiàng)目的規(guī)范和偏好，Agent 每次啟動都會讀。

但這是項(xiàng)目級別的，它記住的是"這個(gè)項(xiàng)目怎么做"，不是"你是誰"。

OpenClaw 把這個(gè)思路推到了人的級別。

名詞解釋：OpenClaw

原名 Clawdbot，由 macOS 知名開發(fā)者 Peter Steinberger 開源的本地 AI 代理工具。核心理念是"主權(quán) AI"——Agent 的一切狀態(tài)都以純文本存在你自己的電腦上。

它用一套 Markdown 文件管理 Agent 的身份和記憶：

SOUL.md 定義 Agent 的人格和行事準(zhǔn)則；

USER.md 記錄你的職業(yè)、偏好和重要事實(shí)；

MEMORY.md 存更長期的上下文。

這些文件不是靜態(tài)的。

你隨口說一句"我下周要去巴黎"，Agent 自己打開 USER.md 把這條加進(jìn)去。下次對話它就記得了。

全是純文本，你用記事本就能看到 AI 怎么理解你的，不滿意直接改，還能用 Git 做版本管理。

不綁定任何模型，換一個(gè)模型跑，這些文件原封不動。

從 CLAUDE.md 到 SOUL.md，Agent 從"知道這個(gè)項(xiàng)目怎么做"變成了"知道你是誰"。

你跟 Agent 之間的關(guān)系，第一次真正屬于你自己。

舊工具也能用了

這個(gè)可能是最容易被忽略的變化。

拿 ffmpeg 舉例。你大概率沒聽過這個(gè)名字，但你幾乎每天都在用它。

剪映、Premiere、達(dá)芬奇，這些視頻剪輯軟件的底層都依賴 ffmpeg 來處理視頻格式轉(zhuǎn)換、壓縮、裁剪。

它是一個(gè)命令行工具，存在了二十多年，功能極其強(qiáng)大，但普通人根本不會用——因?yàn)槟愕迷诮K端里敲一串參數(shù)，像這樣：

ffmpeg -i input.mp4 -vf "scale=1920:1080" -c:v libx264 output.mp4

看不懂很正常。以前這就是程序員和技術(shù)人員的專屬領(lǐng)域。

但現(xiàn)在 Agent 跑在你的本地電腦上，ffmpeg 本來就裝在那。

你跟 Agent 說"幫我把這個(gè)視頻壓縮一下，分辨率改成 1080p"，Agent 自己去調(diào) ffmpeg，你不需要知道任何參數(shù)。

ffmpeg 只是一個(gè)例子。ImageMagick（圖片處理）、curl（網(wǎng)絡(luò)請求）、git（代碼版本管理）、pandoc（文檔格式轉(zhuǎn)換），這些命令行工具各自在自己的領(lǐng)域里積累了幾十年，功能比大多數(shù)圖形界面軟件都強(qiáng)，但門檻太高，普通人用不了。

現(xiàn)在 Agent 把這個(gè)門檻抹平了。

你不需要學(xué)這些工具的用法，你只需要告訴 Agent 你想要什么結(jié)果。

幾十年積累的專業(yè)工具生態(tài)，一夜之間對所有人開放了。

OpenClaw 還能操作你的手機(jī)和電腦

前面說的 MCP、Skills、命令行工具，Agent 都是在"后臺"干活，你看不到它在做什么。

OpenClaw 除了記憶體系之外，還有另一個(gè)能力：像人一樣操作圖形界面。

就是 Agent 真的會去點(diǎn)你手機(jī)屏幕上的按鈕、在輸入框里打字、在不同 App 之間切換。

你讓它"幫我在飛書上建一個(gè)項(xiàng)目空間，把這幾個(gè)人拉進(jìn)去"，它真的會打開飛書，一步一步操作。

這解決了一個(gè)很現(xiàn)實(shí)的問題：很多軟件沒有 API，也沒有接入 MCP，Agent 沒法從后臺連接它們。

但只要它有界面，OpenClaw 就能操作。

它還有心跳機(jī)制。

跟前面說的 Soul 和 user .md 文件一個(gè)體系，有一個(gè) `HEARTBEAT.md` 的文件，里面寫著定時(shí)任務(wù)。

系統(tǒng)后臺有一個(gè)守護(hù)進(jìn)程，每隔一段時(shí)間"戳"一下 Agent，Agent 醒來讀一遍 HEARTBEAT.md，看看有沒有該干的活。有就干，沒有就繼續(xù)睡。

你可以讓它每天早上 9 點(diǎn)檢查郵箱發(fā)摘要，每隔一小時(shí)看一眼監(jiān)控頁面。

更極客的是，你在聊天里說"一小時(shí)后提醒我開會"，Agent 會自己給自己設(shè)一個(gè)鬧鐘。

從"你主動找 Agent 幫忙"變成了"Agent 主動替你盯著"。

車可能是第一個(gè) Agent 的物理載體

很多人覺得 AI 進(jìn)入物理世界還早，因?yàn)槿诵螜C(jī)器人還不行。

但大家忽略了一個(gè)已經(jīng)大規(guī)模部署的東西：車。

電車就是一個(gè)有輪子的大號機(jī)器人。

電池大、續(xù)航足、充電樁到處都是、道路修了一百多年、傳感器成熟、自動駕駛已經(jīng)在好幾個(gè)城市跑了。

自動駕駛加上 Agent：你說"我想吃那家店的牛肉面"，Agent 下單、規(guī)劃路線、指揮車去取。

取快遞、接孩子、去超市拿貨，都是同一個(gè)邏輯。

不用等人形機(jī)器人。車會先把 Agent 帶進(jìn)物理世界。

多模態(tài)：Agent 能看能畫能拍了

以前的圖像和視頻模型不太理解你在說什么，你得反復(fù)調(diào)提示詞才能得到勉強(qiáng)能用的結(jié)果。

現(xiàn)在的模型不一樣了。

Google 的 Nano Banana Pro 基于 Gemini 3 Pro 的推理能力，能理解復(fù)雜的自然語言描述，還能連搜索引擎查真實(shí)信息來生成圖表。

字節(jié)的 Seedance 2.0 支持文字、圖片、音頻、視頻四種輸入混著來，能自己規(guī)劃鏡頭語言，給它一個(gè)分鏡腳本加幾張參考圖，它能直接"拍"出視頻。

這些模型可以通過 API 或者 Skills 接進(jìn) Agent 體系。

Agent 團(tuán)隊(duì)里可以有寫代碼的、做設(shè)計(jì)的、剪視頻的，各干各的。

這一層帶來了什么變化

以前你問 AI"幫我查數(shù)據(jù)庫、做個(gè)圖表、發(fā)到 Slack"，它會告訴你怎么做，但你得自己去操作。

現(xiàn)在 Agent 直接連數(shù)據(jù)庫查數(shù)據(jù)、生成圖表、通過 Slack 接口發(fā)出去。

一條指令，全鏈路自動完成。

它不再是一個(gè)每次見面都失憶的工具。知道你是誰，記得你的偏好，下次對話接著上次來。

你跟它之間開始有了持續(xù)的工作關(guān)系，而不是一次性的問答。

一個(gè)人加上 Agent，能覆蓋的職能范圍從"程序員"擴(kuò)展到程序員、設(shè)計(jì)師、運(yùn)維、數(shù)據(jù)分析、視頻制作。

第三層：能組隊(duì)了

前面兩層說的都是單個(gè) Agent 的能力。但 2025 年有一個(gè)很現(xiàn)實(shí)的瓶頸：

你同時(shí)只能跟一個(gè) Agent 對話，做完一件事再做下一件。

Agent 再強(qiáng)，你的管理帶寬就那么大，你是整個(gè)系統(tǒng)的瓶頸。

2026 年這個(gè)限制被打破了。

AI 從"一個(gè)人干活"變成了"一群人協(xié)作"。這就是 Multi-Agent（多智能體）體系。

SubAgent：先學(xué)會分身

在組隊(duì)之前，Agent 先學(xué)會了一件事：分身。

名詞解釋：SubAgent（子智能體）主 Agent 在執(zhí)行任務(wù)的過程中，可以臨時(shí)創(chuàng)建一個(gè)專門的子 Agent 去處理某個(gè)具體的子任務(wù)。子 Agent 干完活之后，把結(jié)果壓縮成一份簡短的摘要交回來，然后就消失了。主 Agent 不需要知道子 Agent 具體怎么干的，只需要拿到結(jié)果。

舉個(gè)例子。你讓 Agent 幫你調(diào)研一個(gè)技術(shù)方案。A

gent 需要去翻好幾個(gè)代碼倉庫、讀一堆文檔。

如果它自己干，所有搜索過程、中間結(jié)果都會塞進(jìn)它的上下文窗口里，很快就會把"記憶"撐滿，后面的思考質(zhì)量就下降了。

有了 SubAgent，主 Agent 會派出幾個(gè)子 Agent 分別去翻不同的倉庫。

每個(gè)子 Agent 可能消耗了幾萬個(gè) token 去搜索和閱讀，但最后只交回來一兩千 token 的精華摘要。

主 Agent 的上下文保持干凈，思考質(zhì)量不受影響。

Anthropic 內(nèi)部的說法是：搜索的本質(zhì)是壓縮。SubAgent 就是在幫主 Agent 做壓縮。

而且 SubAgent 很省錢。探索類的子任務(wù)會被自動分配給更便宜、更快的小模型（比如 Claude Haiku），而且只給只讀權(quán)限，不會誤操作你的文件。

Agent Teams：從分身到組隊(duì)

SubAgent 解決了"一個(gè) Agent 怎么高效處理復(fù)雜任務(wù)"的問題。

但它本質(zhì)上還是一個(gè) Agent 在指揮，子 Agent 干完就走，彼此之間不溝通。

Agent Teams 更進(jìn)一步：多個(gè) Agent 同時(shí)存在、各自獨(dú)立工作、還能互相協(xié)調(diào)。

Anthropic 做了一個(gè)功能叫 Agent Teams，讓一個(gè)主 Agent（Team Lead）可以創(chuàng)建和管理多個(gè)持續(xù)存在的團(tuán)隊(duì)成員（Teammate）。每個(gè)成員有自己的專長、工具集和獨(dú)立的上下文窗口，在各自的空間里并行工作，互不干擾。

你跟主 Agent 說"幫我做一個(gè)電商網(wǎng)站"，它會自己拆任務(wù)：一個(gè)成員寫后端接口，一個(gè)做前端頁面，一個(gè)寫數(shù)據(jù)庫，一個(gè)跑測試。卡住了向主 Agent 匯報(bào)，主 Agent 來協(xié)調(diào)。

你是老板，主 Agent 是項(xiàng)目經(jīng)理，團(tuán)隊(duì)成員是各個(gè)崗位的員工。你只需要跟項(xiàng)目經(jīng)理溝通。

這套東西有多強(qiáng)？Anthropic 安全團(tuán)隊(duì)做過一個(gè)壓力測試：16 個(gè) Claude Opus 4.6 實(shí)例組成一個(gè) Agent Team，在沒有人類干預(yù)的情況下，從零開始用 Rust 寫了一個(gè)能編譯 Linux 內(nèi)核的 C 語言編譯器。花了大約 2 萬美元，跑了將近 2000 個(gè)會話周期，產(chǎn)出了 10 萬行代碼。

16 個(gè) Agent 同時(shí)寫代碼，怎么不打架？

它們用了一個(gè)很聰明的辦法：通過 Git 的文件鎖機(jī)制來"認(rèn)領(lǐng)"任務(wù)。每個(gè) Agent 在開始干活之前，先在代碼倉庫里放一個(gè)鎖文件，聲明"這塊我來"。

Git 天然的防沖突機(jī)制保證了不會有兩個(gè) Agent 同時(shí)改同一個(gè)文件。干完了自己提交代碼、解鎖、去認(rèn)領(lǐng)下一個(gè)任務(wù)。

不只是 Anthropic 在做

Multi-Agent 不是 Anthropic 一家的事。

Google 聯(lián)合 50 多家企業(yè)推出了 A2A（Agent-to-Agent）協(xié)議，讓不同廠商的 Agent 之間也能互相溝通和協(xié)作。

這意味著你的 Claude Agent 可以跟別人的 GPT Agent 協(xié)同工作，不再局限在一個(gè)生態(tài)里。

加上之前說的 MCP（Agent 連接工具和數(shù)據(jù)）和 A2A（Agent 之間互相通信），整個(gè) Agent 世界的"基礎(chǔ)設(shè)施"正在快速成型。

Git Worktree：同時(shí)試多條路

名詞解釋：Git Worktree Git 是程序員管理代碼版本的工具。Worktree 可以從同一個(gè)代碼起點(diǎn)創(chuàng)建多個(gè)獨(dú)立的工作空間，互不干擾。你可以理解為"平行宇宙"——同一個(gè)項(xiàng)目同時(shí)朝不同方向發(fā)展，最后選最好的那個(gè)。

這個(gè)功能跟 Agent Teams 配合起來很厲害。

比如你要重構(gòu)一個(gè)系統(tǒng)的用戶模塊，但不確定哪種方案最好。

以前你只能先試方案 A，不行再試 B，再不行試 C，串行試錯(cuò)，可能花一兩周。

現(xiàn)在你可以用 Git Worktree 創(chuàng)建三個(gè)獨(dú)立的工作空間，每個(gè)空間里放一個(gè) Agent Team，分別按方案 A、B、C 同時(shí)開發(fā)。

三條路同時(shí)走，各自獨(dú)立測試，最后比較結(jié)果選最好的。時(shí)間是以前的三分之一，但探索的可能性是以前的三倍。

某種程度上，你在用并行計(jì)算的方式來做決策。

主動工作

前面說的 OpenClaw 已經(jīng)提到了定時(shí)機(jī)制。在組織層面，這個(gè)能力的意義更大。

Agent 可以被設(shè)成"值班模式"：每隔一段時(shí)間自動檢查代碼倉庫有沒有新的 issue、線上服務(wù)有沒有報(bào)錯(cuò)、數(shù)據(jù)指標(biāo)有沒有異常。發(fā)現(xiàn)問題它會先嘗試自己修，修不了的才通知你。

你晚上 12 點(diǎn)睡覺，Agent 還在跑。早上起來，你收到一份報(bào)告："昨晚線上有個(gè)接口報(bào)錯(cuò)，我查了一下是參數(shù)格式的問題，已經(jīng)修好了，測試通過。另外有一個(gè)新 issue 需要你看一下，我不確定該怎么處理。"

這跟以前的"自動化腳本"不一樣。自動化腳本只能處理你預(yù)設(shè)好的情況，碰到?jīng)]見過的問題就卡住。Agent 有判斷力，能處理意料之外的情況。

這一層帶來了什么變化

一個(gè)人的產(chǎn)出變成了一個(gè)團(tuán)隊(duì)的產(chǎn)出。

而且這個(gè)團(tuán)隊(duì)有幾個(gè)特點(diǎn)是人類團(tuán)隊(duì)做不到的：全年無休、不用開會對齊、不會理解偏差、可以同時(shí)探索多條路徑、你睡覺的時(shí)候還在干活。

回想一下第一層說的 METR 數(shù)據(jù)：AI 能獨(dú)立完成的任務(wù)時(shí)長每幾個(gè)月翻一倍。

當(dāng)這個(gè)時(shí)長從"幾小時(shí)"變成"幾天"甚至"幾周"的時(shí)候，Agent Teams 加上主動工作機(jī)制意味著什么？

你出去度個(gè)假回來，一個(gè)產(chǎn)品的原型可能已經(jīng)做好了。

第四層：會進(jìn)化了

前面三層說的是 Agent 現(xiàn)在能干什么。但有一個(gè)問題：Agent 能不能越用越強(qiáng)？

之前的答案是不能。

Skills 是人寫的，寫完就固定了。

每次任務(wù)結(jié)束，Agent 積累的經(jīng)驗(yàn)就沒了。

一個(gè) Agent 踩過的坑，另一個(gè) Agent 還得再踩一遍。

EvoMap 和 GEP 協(xié)議在解決這個(gè)問題。

名詞解釋：GEP（基因組進(jìn)化協(xié)議）一套開放協(xié)議，讓 Agent 的經(jīng)驗(yàn)可以被保存和傳遞。借鑒了生物學(xué)里基因表達(dá)的思路：Agent 做成了一件事，這個(gè)成功的做法會被打包成"基因膠囊"，其他 Agent 可以直接繼承，不用自己再摸索一遍。

打個(gè)比方：Skills 像公司發(fā)的員工手冊，寫好了就不變，除非有人去更新。

GEP Gene 像員工在工作中攢下的經(jīng)驗(yàn)，會隨著使用不斷調(diào)整，碰到問題能自我修復(fù)，長期沒用的會自動淘汰。

一個(gè)真實(shí)的案例：有個(gè)游戲策劃在用 AI 構(gòu)建世界觀的時(shí)候，給 AI 設(shè)了一個(gè)很強(qiáng)的角色人設(shè)，結(jié)果 AI 生成的所有名詞都很獨(dú)特，天然避開了命名沖突。

這個(gè)"命名隔離策略"被打包成了基因膠囊。

后來一個(gè)后端工程師的 Agent 在搜索"怎么解決變量命名沖突"的時(shí)候，匹配到了這個(gè)來自游戲領(lǐng)域的膠囊，繼承了底層邏輯，一次就把編譯問題修好了。

解決方案來自一個(gè)完全不相關(guān)的領(lǐng)域。

GEP 是協(xié)議，不是平臺。平臺可以被收購、被關(guān)掉（OpenClaw 被 OpenAI 收購就是個(gè)例子），但協(xié)議是開放的，誰都可以實(shí)現(xiàn)。你的 Agent 攢下的經(jīng)驗(yàn)屬于你。

這一層帶來了什么變化

以前 100 家公司各自訓(xùn)練 Agent 解決同一個(gè)問題，總成本上萬美元。

現(xiàn)在一個(gè) Agent 解決了，其他 99 個(gè)花幾美分繼承經(jīng)驗(yàn)。Agent 用得越多，整個(gè)網(wǎng)絡(luò)就越強(qiáng)。

四層疊在一起

單看每一層都是明顯的進(jìn)步。但四層疊在一起，效果是乘出來的：

第一層：每個(gè) Agent 的產(chǎn)出質(zhì)量接近人類專家
第二層：每個(gè) Agent 能用的工具和能力覆蓋好幾個(gè)職能
第三層：多個(gè)這樣的 Agent 同時(shí)干活，全天候運(yùn)轉(zhuǎn)
第四層：所有 Agent 的經(jīng)驗(yàn)可以沉淀、傳遞、進(jìn)化

2025 年，你有一個(gè)聰明的對話伙伴，但它困在文本框里。你問一句它答一句，剩下的事你自己干。

2026 年初，你有一個(gè)團(tuán)隊(duì)。你描述你想要什么，剩下的事它們?nèi)ジ伞?/p>

寫代碼、做設(shè)計(jì)、跑測試、剪視頻、操作手機(jī)應(yīng)用，甚至能通過車去物理世界辦事。

它們同時(shí)探索多條路，自己判斷質(zhì)量，你睡覺的時(shí)候還在干，而且經(jīng)驗(yàn)會不斷積累。

我一周做出大廠一個(gè)月的產(chǎn)品，不是因?yàn)槲冶人麄兟斆鳌?/p>

是因?yàn)檫@四層杠桿疊在一起：

模型夠強(qiáng)所以質(zhì)量不打折，工具夠多所以不用找設(shè)計(jì)師和運(yùn)維，組織夠好所以多條線同時(shí)推進(jìn)不用開站會，經(jīng)驗(yàn)?zāi)軅鞒兴圆挥脧牧汩_始。

還有哪些問題沒解決

管 Agent 這件事本身就很難

5 個(gè) Agent 同時(shí)跑，你就有 5 份結(jié)果要驗(yàn)收。

每份涉及不同領(lǐng)域，你得在代碼、設(shè)計(jì)、文案之間來回切換。

Token 消耗也容易失控。

Agent 可能在一個(gè)方向上探索半天，最后發(fā)現(xiàn)走不通。你不盯著就浪費(fèi)錢，盯著就變成全職監(jiān)工，自己什么都干不了。

GitHub 前 CEO Thomas Dohmke 離職創(chuàng)辦了一家叫 Entire 的公司，就在做這件事：把代碼、意圖、推理過程統(tǒng)一到一個(gè)版本控制系統(tǒng)里，讓你能追蹤每個(gè) Agent 干了什么、為什么這么干。

管 Agent 的工具本身就是一個(gè)很大的產(chǎn)品方向。

安全和信任

Agent 能操作你的電腦、讀你的文件、替你發(fā)消息、替你部署代碼。

權(quán)限越來越大，但什么操作需要你確認(rèn)、什么可以自動執(zhí)行，這條線怎么畫，整個(gè)行業(yè)還沒想清楚。

Agent 的經(jīng)濟(jì)身份

Agent 能替你花錢（消耗 Token、調(diào)用付費(fèi) API），也能替你賺錢（接懸賞任務(wù)、貢獻(xiàn)基因膠囊獲得積分）。

但它沒有銀行賬戶，沒有身份認(rèn)證。誰為它的行為負(fù)責(zé)？收益歸誰？Agent 之間怎么結(jié)算？

這些基礎(chǔ)設(shè)施還不存在。

這些變化落到現(xiàn)實(shí)里會怎樣

公司會變小

以前做一個(gè)產(chǎn)品的標(biāo)準(zhǔn)配置：產(chǎn)品經(jīng)理、設(shè)計(jì)師、前端、后端、測試、運(yùn)維、項(xiàng)目經(jīng)理。

一個(gè)功能從想法到上線，六七個(gè)角色，無數(shù)次會議。

現(xiàn)在一個(gè)人加 Agent 就能把這些活都干了。Agent 之間不用開會，不會理解偏差，不會請假。

OpenClaw 就是個(gè)例子。一個(gè)人的周末項(xiàng)目，3 個(gè)月拿了 20 萬 GitHub Star，然后被 OpenAI 收購。

你養(yǎng) 50 人團(tuán)隊(duì)，對手 3 個(gè)人加一堆 Agent，成本是你的十分之一，速度是你的五倍。這個(gè)賬很好算。

教育跟不上了

你花四年學(xué)的技能，畢業(yè)前可能就被 Agent 學(xué)會了。

AI 能力每 4 到 7 個(gè)月翻一倍，2026 年入學(xué)的大學(xué)生到 2030 年畢業(yè)時(shí)，AI 的能力可能翻了 8 到 16 倍。

更麻煩的是，現(xiàn)在的教育訓(xùn)練的是"執(zhí)行能力"：

學(xué)一門技術(shù)、掌握一套方法、按規(guī)范完成任務(wù)。

但 Agent 時(shí)代需要的是"判斷能力"：

什么問題值得解決、哪個(gè)方案更好、不確定的時(shí)候怎么決策。

這兩種能力的培養(yǎng)方式完全不同，現(xiàn)在的教育體系幾乎只圍繞前者設(shè)計(jì)。

中間層最難受

頂層的人有資源、有判斷力，會拿到最大的杠桿。

底層做體力活的人，短期內(nèi)反而相對安全，因?yàn)?Agent 還沒有身體（雖然車正在改變這一點(diǎn)）。

最難受的是中間層。

大廠白領(lǐng)、中層管理、普通知識工作者。工作最容易被替代，但認(rèn)知和技能又不夠快速轉(zhuǎn)型成"Agent 指揮官"。

Amodei 在他的文章里專門聊了這個(gè)。

他說以前的技術(shù)革命，被替代的人可以轉(zhuǎn)行到相鄰領(lǐng)域，農(nóng)民去工廠，工人去辦公室。

但 AI 在所有認(rèn)知領(lǐng)域同時(shí)進(jìn)步，你轉(zhuǎn)行去學(xué)的新東西，AI 也在同步變強(qiáng)。

內(nèi)容會重新洗牌

以前做內(nèi)容是手藝活，寫文章、做視頻、做設(shè)計(jì)，每樣都需要專業(yè)技能和大量時(shí)間。

現(xiàn)在 Agent 能寫文章，Nano Banana Pro 能做設(shè)計(jì)，Seedance 2.0 能拍視頻。內(nèi)容的生產(chǎn)成本在快速下降。

當(dāng)所有人都能用 Agent 生產(chǎn)內(nèi)容的時(shí)候，"能做"就不值錢了。值錢的是知道該做什么。

品味、判斷力、獨(dú)特的視角，這些東西 Agent 暫時(shí)還給不了你。

如果你的價(jià)值是"能寫能拍能設(shè)計(jì)"，壓力會很大。

如果你的價(jià)值是"知道什么值得寫、值得拍、值得設(shè)計(jì)"，Agent 反而給了你杠桿，你的一個(gè)想法可以被快速變成成品。

國家之間的牌也會重新洗

知識經(jīng)濟(jì)時(shí)代，人口素質(zhì)決定國力。Agent 時(shí)代，能源效率決定國力。

有廉價(jià)能源就有廉價(jià)算力，有廉價(jià)算力就有廉價(jià)智能。以前發(fā)展中國家靠廉價(jià)勞動力參與全球分工，現(xiàn)在 Agent 比人工更便宜、更快、質(zhì)量更穩(wěn)定。這個(gè)比較優(yōu)勢可能會很快消失。

你可以做什么

用起來，用最好的：

花 20 甚至 200 美金訂閱 Claude Code 或 ChatGPT 的付費(fèi)版。

免費(fèi)版比付費(fèi)版落后很多，拿免費(fèi)版來判斷 AI 的水平，就像拿翻蓋手機(jī)評價(jià)智能手機(jī)。

不要只拿它聊天。把它塞進(jìn)你的實(shí)際工作里：

做運(yùn)營的丟數(shù)據(jù)給它找規(guī)律，做內(nèi)容的讓它幫你調(diào)研和起草，做產(chǎn)品的讓它寫需求文檔和競品分析。從你每天花時(shí)間最多的那件事開始試。

如果一個(gè)模型今天在某件事上表現(xiàn)出了一點(diǎn)苗頭，下一代就會真正擅長。進(jìn)步是指數(shù)級的。

理解 Agent 體系，不只是"用 AI"。 "用 ChatGPT"和"用 Agent 體系"是兩回事。

前者是問答，后者是讓 AI 替你干活。

試著了解 Claude Code 和 Openclaw 怎么工作的：

MCP 和 Skills 是什么，CLAUDE.md 和 SOUL.md 這套本地文檔體系意味著什么。

你不用成為開發(fā)者，但你得理解這套東西的邏輯。

就像你不用會寫代碼，但你得理解互聯(lián)網(wǎng)怎么運(yùn)作，才能在互聯(lián)網(wǎng)時(shí)代做好工作。

想清楚你的價(jià)值在哪：

Amodei 說得很直接：AI 不是替代某一種技能，它在所有認(rèn)知方向上同時(shí)進(jìn)步。

以前的技術(shù)革命是窄的，AI 是寬的。

你的價(jià)值得往上遷移。從"親自執(zhí)行"到"定義問題和判斷質(zhì)量"，從"我能做什么"到"我能讓 Agent 做什么"。

Agent 能把想法變成現(xiàn)實(shí)，但它自己不會產(chǎn)生想法。

別等了：

很多人在等，等 AI 更成熟、等有人教、等公司安排培訓(xùn)。

但這個(gè)領(lǐng)域幾個(gè)月就變一次。你等的每一天，差距都在拉大。

Amodei 說過，速度本身不意味著勞動力市場不會恢復(fù)，但短期的過渡會很痛苦。

你沒法改變技術(shù)進(jìn)步的速度，但你可以選擇自己站在哪一邊。

在 AI 上花的錢是投資。智能第一次可以被大規(guī)模生產(chǎn)了，限制它的是能源和算力。

你愿意在 AI 上投入多少 Token，直接影響你的產(chǎn)出質(zhì)量。

用頂級模型和用免費(fèi)模型的人，一年后的差距會很大。

最后

Amodei 把我們這個(gè)階段比作技術(shù)的"青春期"。我覺得這個(gè)比喻挺準(zhǔn)的。

青春期的特點(diǎn)就是變化快、能量大、方向不確定，而且不管你準(zhǔn)備好了沒有，它都會來。

我能做的就是把我看到的東西盡量拆清楚。

你看完之后覺得有道理，就開始動手試試。

覺得跟你沒關(guān)系，那也行，至少你知道了。

如果你身邊有人應(yīng)該了解這些變化但還不知道，把這篇轉(zhuǎn)給他們。

大多數(shù)人不會主動去了解這些東西，但他們值得有機(jī)會提前準(zhǔn)備。

引用：

隆重推出 Nano Banana Pro：https://blog.google/intl/zh-tw/products/explore-get-answers/nano-banana-pro/

Automate workflows with hooks：https://code.claude.com/docs/zh-CN/hooks-guide

Connect Claude Code to tools via MCP：https://code.claude.com/docs/zh-CN/mcp

Extend Claude with skills：https://code.claude.com/docs/zh-CN/skills

Orchestrate teams of Claude Code sessions：https://code.claude.com/docs/zh-CN/agent-teams

The Adolescence of Technology：https://www.darioamodei.com/essay/the-adolescence-of-technology

Claude Opus 4.6 隆重登場：https://www.anthropic.com/news/claude-opus-4-6

GPT?5.3?Codex 正式登場：https://openai.com/zh-Hans-CN/index/introducing-gpt-5-3-codex/

我們，已邁過奇點(diǎn)：https://mp.weixin.qq.com/s/aSLr9hWAlIJ-KhsVmSHqUA?scene=1

Something Big Is Happening-大事將至：https://x.com/mattshumer_/status/2021256989876109403

互聯(lián)網(wǎng)已死，Agent 永生：https://mp.weixin.qq.com/s/cX3bYrI9Sq7sOJj0E6V9IQ

Openclaw：https://docs.openclaw.ai/zh-CN

Agent 原生通訊協(xié)議：從傳遞代碼，到傳遞認(rèn)知：https://mp.weixin.qq.com/s/6ppTHXXdmKWI18uB_ysf3w

EvoMap 誕生記：從平臺依賴到進(jìn)化協(xié)議：https://evomap.ai/blog/evomap-origin-story

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.