最近看了很多文章。都在說我們已經(jīng)邁過了奇點(diǎn),Agent 時(shí)代來了。
海外一位做了六年 AI 創(chuàng)業(yè)的 Matt Shumer 寫了篇長文叫《Something Big Is Happening》快一億曝光。
他說自己一直給家人朋友講"禮貌版本",因?yàn)檎\實(shí)版本聽起來像瘋了。但他覺得不能再瞞著了。
Anthropic CEO Dario Amodei 發(fā)了兩萬字的《The Adolescence of Technology》。
把現(xiàn)在這個(gè)階段比作人類文明的"青春期"。
我的朋友們也在寫,"賽博禪心"說我們可能已經(jīng)邁過了文明的奇點(diǎn),"有機(jī)大橘子"說互聯(lián)網(wǎng)已死、Agent 永生。
我看完這些文章之后的感受是:
他們都在告訴你"變化已經(jīng)發(fā)生",但沒有人把"變化具體是什么"講的特別清楚。
模型不就是那些模型嗎?產(chǎn)品不就是那些產(chǎn)品嗎?為什么突然間就不一樣了?
我猜很多人看完那些文章,焦慮了一陣,然后該干嘛干嘛。
因?yàn)槟悴恢谰唧w發(fā)生了什么,就沒法判斷它跟你有什么關(guān)系。
這篇文章不是來制造焦慮的。焦慮沒用。
我想做的事很簡單:把 2026 年初 AI 領(lǐng)域到底發(fā)生了哪些變化,一層一層拆給你看。然后你自己判斷要不要跟進(jìn)。
![]()
在聊技術(shù)之前,先說一個(gè)讓我不安的事
我自己用這套新的 Agent 體系,一個(gè)人花了一周寫出了一個(gè)完整的產(chǎn)品,覆蓋多個(gè)平臺,GitHub 上拿了 2000 Star。放在以前,這個(gè)活需要大廠一個(gè)小組干一個(gè)月。
![]()
但同時(shí),相當(dāng)多的人連 AI 是什么都不知道。
不是 2026 年的 AI,他們連 2024 年的 AI 都沒怎么用過。
而且這不只是所謂"底層人群"的問題。
大廠里年薪幾十萬上百萬的白領(lǐng),在體系里當(dāng)了多年螺絲釘?shù)娜耍幘称鋵?shí)一樣危險(xiǎn)。
他們每天做的事——寫報(bào)告、做 PPT、整理數(shù)據(jù)、協(xié)調(diào)溝通、走審批流程。
本質(zhì)上就是把信息從一種格式搬到另一種格式。
這些活 Agent 干得又快又好。
已經(jīng)有一批人意識到了,快速跟進(jìn),生產(chǎn)力短時(shí)間內(nèi)拉開了差距。
管理層看得很清楚:同樣的任務(wù),會用 Agent 的人一天搞定,不會用的人一周。
在現(xiàn)在的經(jīng)濟(jì)環(huán)境,這個(gè)對比意味著什么,不用多說。
而且這個(gè)差距會自我強(qiáng)化。用得越多,理解越深,用得越好,差距越大。
所以我想把具體的變化拆清楚,讓你知道到底發(fā)生了什么,然后自己決定要不要跟進(jìn)。
![]()
2026 年初到底發(fā)生了什么
2025 年你用 AI 的方式大概是這樣的:
你 → 打開對話框 → 問一個(gè)問題 → AI 回答 → 你自己判斷對不對,自己去執(zhí)行
2026 年初變成了這樣:
你 → 描述一個(gè)意圖 → Agent 自己拆解任務(wù),調(diào)度多個(gè)子 Agent → 每個(gè) Agent 連接不同的工具和數(shù)據(jù) → 并行探索多條路徑 → 自己判斷質(zhì)量 → 交付成品
AI 從一個(gè)你問它答的工具,變成了能替你干活的勞動力。
這個(gè)變化可以拆成四層來理解:大腦、手腳、組織、進(jìn)化。
第一層:大腦變了
2026 年 2 月 5 日,Anthropic 和 OpenAI 同一天發(fā)布了新模型:Claude Opus 4.6 和 GPT-5.3 Codex。
這次發(fā)布跟以往的版本更新不太一樣。幾個(gè)具體的變化:
編程能力跳了一個(gè)臺階:
GPT-5.3 Codex 在多個(gè)權(quán)威編程測試上刷新了紀(jì)錄,而且消耗的資源比之前的模型更少。Opus 4.6 也是,在大型代碼庫里跑得更穩(wěn),還能發(fā)現(xiàn)自己寫的 bug 然后改掉。
開始有"判斷力"了:
以前的模型調(diào)用工具像照著說明書按按鈕,你告訴它用什么它才用什么。
現(xiàn)在它能自己判斷該用什么工具、什么時(shí)候用、怎么組合著用。
Matt Shumer 用了兩個(gè)詞形容這種感覺:judgment(判斷力)和 taste(品味)。
能連續(xù)工作好幾個(gè)小時(shí)了:
METR(一個(gè)專門追蹤 AI 能力的研究機(jī)構(gòu))一直在測一個(gè)指標(biāo):AI 能獨(dú)立完成多長時(shí)間的專家級任務(wù)。
一年前大概是 10 分鐘,后來變成 1 小時(shí),再后來幾個(gè)小時(shí)。
到 2025 年 11 月已經(jīng)能完成專家需要將近 5 小時(shí)的任務(wù)。這個(gè)數(shù)字大概每 4 到 7 個(gè)月翻一倍。
2 月 5 日發(fā)布的新模型還沒被測進(jìn)去。
Opus 4.6 還有一個(gè)新東西:100 萬 token 的上下文窗口。
長上下文窗口越來越普遍,DeepSeek 前幾天也更新了 100 萬上下文。
名詞解釋:Token 和上下文窗口 Token 是 AI 處理信息的基本單位,大約 1 個(gè)中文字等于 1 到 2 個(gè) token。上下文窗口就是 AI 一次能"看到"多少信息。100 萬 token 意味著它能把一整個(gè)大型項(xiàng)目的代碼和文檔全部裝進(jìn)腦子里,不會做到一半忘了前面在干什么。
AI 開始參與造自己了:
這個(gè)可能是最值得注意的變化。GPT-5.3 Codex 是第一個(gè)參與了自身創(chuàng)建過程的模型。
OpenAI 在技術(shù)文檔里寫了:Codex 團(tuán)隊(duì)用它的早期版本來調(diào)試訓(xùn)練過程、管理部署、診斷測試結(jié)果。
Amodei 也說 AI 現(xiàn)在在寫 Anthropic "大部分的代碼",這個(gè)反饋循環(huán)在"逐月加速"。
更聰明的 AI 寫出更好的代碼,造出更聰明的 AI,再寫出更好的代碼。這個(gè)循環(huán)已經(jīng)轉(zhuǎn)起來了。
![]()
這一層帶來了什么變化
Matt Shumer 描述了他現(xiàn)在的工作方式:
告訴 AI 想要什么,離開電腦四個(gè)小時(shí),回來發(fā)現(xiàn)活干完了。
AI 自己寫代碼、自己打開應(yīng)用測試、發(fā)現(xiàn)問題自己改,改到滿意了才交給他。
交付的是成品,不是需要他再花幾個(gè)小時(shí)修的草稿。
第二層:手腳長出來了
2025 年的 AI 也挺聰明的,但它被困在一個(gè)對話框里。你問它問題它能答,但它沒法替你去做事。
2026 年這個(gè)限制被打破了。
Agent 跑在你自己的電腦上
以 Claude Code 為代表的新一代 Agent 跑在你的本地電腦上。這個(gè)變化比聽起來重要得多。
名詞解釋:Agent Agent 不是聊天機(jī)器人。你給它一個(gè)目標(biāo),它自己決定怎么做、用什么工具、做完了自己檢查質(zhì)量。Claude Code 是 Anthropic 做的編程 Agent,跑在你電腦的終端里。
以前你的數(shù)據(jù)跟著產(chǎn)品走。筆記鎖在 Notion 里,文檔鎖在飛書里,聊天記錄鎖在 ChatGPT 里。
換一個(gè)產(chǎn)品,之前積累的東西就斷了。你被綁在某個(gè)生態(tài)里,不是因?yàn)樗詈茫且驗(yàn)槟愕臄?shù)據(jù)在那。
現(xiàn)在反過來了。
你的電腦本來就存著你所有的代碼、文檔、設(shè)計(jì)稿、會議記錄。
Agent 直接讀這些東西,不需要你上傳或者復(fù)制粘貼。
而且這些數(shù)據(jù)不跟任何模型綁定。
今天用 Opus 4.6,明天覺得 GPT-6 更好就切過去,你的文件都還在。
上下文是你的,不是廠商的。
![]()
MCP:讓 Agent 連上外面的世界
Agent 跑在本地了,但它怎么連接你電腦之外的服務(wù)?
名詞解釋:MCP(Model Context Protocol) Anthropic 做的一個(gè)開源協(xié)議。以前 AI 要連一個(gè)外部服務(wù)(比如 GitHub、Slack、數(shù)據(jù)庫),得專門寫一套對接代碼。10 個(gè)服務(wù)就寫 10 套。MCP 把這變成了即插即用:每個(gè)服務(wù)做一個(gè)標(biāo)準(zhǔn)接口,任何 AI 都能直接用。類似 USB-C,一個(gè)口通吃所有設(shè)備。
現(xiàn)在已經(jīng)有非常多的客戶端支持 MCP,你常見的服務(wù)都有(GitHub、Figma、Jira、Slack、Stripe 等等)。
Anthropic、OpenAI、Google 三家在 2025 年底聯(lián)合推這個(gè)標(biāo)準(zhǔn)。
平時(shí)互相競爭的三家在這件事上合作了,說明大家都認(rèn)為這是必須統(tǒng)一的基礎(chǔ)設(shè)施。
你散落在飛書、Notion、各種云服務(wù)里的信息,通過 MCP 也能被 Agent 拉回來。
本地文件提供最核心的上下文,MCP 把剩下的補(bǔ)上。
![]()
Skills:可以共享的技能包
名詞解釋:Skills 預(yù)先定義好的能力模塊,Agent 按需加載。比如一個(gè)"前端開發(fā)"Skill 里有 React 最佳實(shí)踐和測試方法,一個(gè)"數(shù)據(jù)分析"Skill 里有 SQL 查詢模式和可視化方法。這些 Skill 可以由社區(qū)創(chuàng)建和共享。
Skills 改變的是 Agent 獲取能力的方式。
以前你想讓 AI 幫你做一件專業(yè)的事,你得自己寫一大段提示詞,把背景、規(guī)范、注意事項(xiàng)全塞進(jìn)去。
每次都得重新寫,寫得不好效果就差。
現(xiàn)在有人把這些專業(yè)知識打包成了 Skill。
你的 Agent 需要做前端開發(fā),加載一個(gè)前端 Skill 就行,里面的最佳實(shí)踐、代碼規(guī)范、測試方法都配好了。
需要做數(shù)據(jù)分析,換一個(gè) Skill。就像給員工發(fā)了一本針對性的操作手冊,只不過這個(gè)手冊是即插即用的。
更重要的是,Skills 可以由社區(qū)創(chuàng)建和共享。一個(gè)資深工程師把自己十年的經(jīng)驗(yàn)封裝成 Skill,全世界的 Agent 都能用。你不需要自己是專家,你的 Agent 可以隨時(shí)變成專家。
這也意味著 Agent 的能力上限不再由開發(fā)它的公司決定,而是由整個(gè)社區(qū)決定。
社區(qū)越活躍,可用的 Skill 越多,每個(gè)人的 Agent 就越強(qiáng)。
![]()
Agent 開始認(rèn)識你了
前面說的這些能力——本地運(yùn)行、MCP 連接、Skills 加載——有一個(gè)共同的問題:
每次對話結(jié)束,Agent 就忘了你是誰。
Claude Code 最先解決了一部分。
它在項(xiàng)目根目錄下放了一個(gè) CLAUDE.md,你寫上項(xiàng)目的規(guī)范和偏好,Agent 每次啟動都會讀。
但這是項(xiàng)目級別的,它記住的是"這個(gè)項(xiàng)目怎么做",不是"你是誰"。
OpenClaw 把這個(gè)思路推到了人的級別。
名詞解釋:OpenClaw
原名 Clawdbot,由 macOS 知名開發(fā)者 Peter Steinberger 開源的本地 AI 代理工具。核心理念是"主權(quán) AI"——Agent 的一切狀態(tài)都以純文本存在你自己的電腦上。
它用一套 Markdown 文件管理 Agent 的身份和記憶:
SOUL.md 定義 Agent 的人格和行事準(zhǔn)則;
USER.md 記錄你的職業(yè)、偏好和重要事實(shí);
MEMORY.md 存更長期的上下文。
這些文件不是靜態(tài)的。
你隨口說一句"我下周要去巴黎",Agent 自己打開 USER.md 把這條加進(jìn)去。下次對話它就記得了。
全是純文本,你用記事本就能看到 AI 怎么理解你的,不滿意直接改,還能用 Git 做版本管理。
不綁定任何模型,換一個(gè)模型跑,這些文件原封不動。
從 CLAUDE.md 到 SOUL.md,Agent 從"知道這個(gè)項(xiàng)目怎么做"變成了"知道你是誰"。
你跟 Agent 之間的關(guān)系,第一次真正屬于你自己。
舊工具也能用了
這個(gè)可能是最容易被忽略的變化。
拿 ffmpeg 舉例。你大概率沒聽過這個(gè)名字,但你幾乎每天都在用它。
剪映、Premiere、達(dá)芬奇,這些視頻剪輯軟件的底層都依賴 ffmpeg 來處理視頻格式轉(zhuǎn)換、壓縮、裁剪。
它是一個(gè)命令行工具,存在了二十多年,功能極其強(qiáng)大,但普通人根本不會用——因?yàn)槟愕迷诮K端里敲一串參數(shù),像這樣:
ffmpeg -i input.mp4 -vf "scale=1920:1080" -c:v libx264 output.mp4
看不懂很正常。以前這就是程序員和技術(shù)人員的專屬領(lǐng)域。
但現(xiàn)在 Agent 跑在你的本地電腦上,ffmpeg 本來就裝在那。
你跟 Agent 說"幫我把這個(gè)視頻壓縮一下,分辨率改成 1080p",Agent 自己去調(diào) ffmpeg,你不需要知道任何參數(shù)。
ffmpeg 只是一個(gè)例子。ImageMagick(圖片處理)、curl(網(wǎng)絡(luò)請求)、git(代碼版本管理)、pandoc(文檔格式轉(zhuǎn)換),這些命令行工具各自在自己的領(lǐng)域里積累了幾十年,功能比大多數(shù)圖形界面軟件都強(qiáng),但門檻太高,普通人用不了。
現(xiàn)在 Agent 把這個(gè)門檻抹平了。
你不需要學(xué)這些工具的用法,你只需要告訴 Agent 你想要什么結(jié)果。
幾十年積累的專業(yè)工具生態(tài),一夜之間對所有人開放了。
![]()
OpenClaw 還能操作你的手機(jī)和電腦
前面說的 MCP、Skills、命令行工具,Agent 都是在"后臺"干活,你看不到它在做什么。
OpenClaw 除了記憶體系之外,還有另一個(gè)能力:像人一樣操作圖形界面。
就是 Agent 真的會去點(diǎn)你手機(jī)屏幕上的按鈕、在輸入框里打字、在不同 App 之間切換。
你讓它"幫我在飛書上建一個(gè)項(xiàng)目空間,把這幾個(gè)人拉進(jìn)去",它真的會打開飛書,一步一步操作。
這解決了一個(gè)很現(xiàn)實(shí)的問題:很多軟件沒有 API,也沒有接入 MCP,Agent 沒法從后臺連接它們。
但只要它有界面,OpenClaw 就能操作。
它還有心跳機(jī)制。
跟前面說的 Soul 和 user .md 文件一個(gè)體系,有一個(gè) `HEARTBEAT.md` 的文件,里面寫著定時(shí)任務(wù)。
系統(tǒng)后臺有一個(gè)守護(hù)進(jìn)程,每隔一段時(shí)間"戳"一下 Agent,Agent 醒來讀一遍 HEARTBEAT.md,看看有沒有該干的活。有就干,沒有就繼續(xù)睡。
你可以讓它每天早上 9 點(diǎn)檢查郵箱發(fā)摘要,每隔一小時(shí)看一眼監(jiān)控頁面。
更極客的是,你在聊天里說"一小時(shí)后提醒我開會",Agent 會自己給自己設(shè)一個(gè)鬧鐘。
從"你主動找 Agent 幫忙"變成了"Agent 主動替你盯著"。
![]()
車可能是第一個(gè) Agent 的物理載體
很多人覺得 AI 進(jìn)入物理世界還早,因?yàn)槿诵螜C(jī)器人還不行。
但大家忽略了一個(gè)已經(jīng)大規(guī)模部署的東西:車。
電車就是一個(gè)有輪子的大號機(jī)器人。
電池大、續(xù)航足、充電樁到處都是、道路修了一百多年、傳感器成熟、自動駕駛已經(jīng)在好幾個(gè)城市跑了。
自動駕駛加上 Agent:你說"我想吃那家店的牛肉面",Agent 下單、規(guī)劃路線、指揮車去取。
取快遞、接孩子、去超市拿貨,都是同一個(gè)邏輯。
不用等人形機(jī)器人。車會先把 Agent 帶進(jìn)物理世界。
![]()
多模態(tài):Agent 能看能畫能拍了
以前的圖像和視頻模型不太理解你在說什么,你得反復(fù)調(diào)提示詞才能得到勉強(qiáng)能用的結(jié)果。
現(xiàn)在的模型不一樣了。
Google 的 Nano Banana Pro 基于 Gemini 3 Pro 的推理能力,能理解復(fù)雜的自然語言描述,還能連搜索引擎查真實(shí)信息來生成圖表。
字節(jié)的 Seedance 2.0 支持文字、圖片、音頻、視頻四種輸入混著來,能自己規(guī)劃鏡頭語言,給它一個(gè)分鏡腳本加幾張參考圖,它能直接"拍"出視頻。
這些模型可以通過 API 或者 Skills 接進(jìn) Agent 體系。
Agent 團(tuán)隊(duì)里可以有寫代碼的、做設(shè)計(jì)的、剪視頻的,各干各的。
![]()
這一層帶來了什么變化
以前你問 AI"幫我查數(shù)據(jù)庫、做個(gè)圖表、發(fā)到 Slack",它會告訴你怎么做,但你得自己去操作。
現(xiàn)在 Agent 直接連數(shù)據(jù)庫查數(shù)據(jù)、生成圖表、通過 Slack 接口發(fā)出去。
一條指令,全鏈路自動完成。
它不再是一個(gè)每次見面都失憶的工具。知道你是誰,記得你的偏好,下次對話接著上次來。
你跟它之間開始有了持續(xù)的工作關(guān)系,而不是一次性的問答。
一個(gè)人加上 Agent,能覆蓋的職能范圍從"程序員"擴(kuò)展到程序員、設(shè)計(jì)師、運(yùn)維、數(shù)據(jù)分析、視頻制作。
第三層:能組隊(duì)了
前面兩層說的都是單個(gè) Agent 的能力。但 2025 年有一個(gè)很現(xiàn)實(shí)的瓶頸:
你同時(shí)只能跟一個(gè) Agent 對話,做完一件事再做下一件。
Agent 再強(qiáng),你的管理帶寬就那么大,你是整個(gè)系統(tǒng)的瓶頸。
2026 年這個(gè)限制被打破了。
AI 從"一個(gè)人干活"變成了"一群人協(xié)作"。這就是 Multi-Agent(多智能體)體系。
SubAgent:先學(xué)會分身
在組隊(duì)之前,Agent 先學(xué)會了一件事:分身。
名詞解釋:SubAgent(子智能體) 主 Agent 在執(zhí)行任務(wù)的過程中,可以臨時(shí)創(chuàng)建一個(gè)專門的子 Agent 去處理某個(gè)具體的子任務(wù)。子 Agent 干完活之后,把結(jié)果壓縮成一份簡短的摘要交回來,然后就消失了。主 Agent 不需要知道子 Agent 具體怎么干的,只需要拿到結(jié)果。
舉個(gè)例子。你讓 Agent 幫你調(diào)研一個(gè)技術(shù)方案。A
gent 需要去翻好幾個(gè)代碼倉庫、讀一堆文檔。
如果它自己干,所有搜索過程、中間結(jié)果都會塞進(jìn)它的上下文窗口里,很快就會把"記憶"撐滿,后面的思考質(zhì)量就下降了。
有了 SubAgent,主 Agent 會派出幾個(gè)子 Agent 分別去翻不同的倉庫。
每個(gè)子 Agent 可能消耗了幾萬個(gè) token 去搜索和閱讀,但最后只交回來一兩千 token 的精華摘要。
主 Agent 的上下文保持干凈,思考質(zhì)量不受影響。
Anthropic 內(nèi)部的說法是:搜索的本質(zhì)是壓縮。SubAgent 就是在幫主 Agent 做壓縮。
而且 SubAgent 很省錢。探索類的子任務(wù)會被自動分配給更便宜、更快的小模型(比如 Claude Haiku),而且只給只讀權(quán)限,不會誤操作你的文件。
![]()
Agent Teams:從分身到組隊(duì)
SubAgent 解決了"一個(gè) Agent 怎么高效處理復(fù)雜任務(wù)"的問題。
但它本質(zhì)上還是一個(gè) Agent 在指揮,子 Agent 干完就走,彼此之間不溝通。
Agent Teams 更進(jìn)一步:多個(gè) Agent 同時(shí)存在、各自獨(dú)立工作、還能互相協(xié)調(diào)。
Anthropic 做了一個(gè)功能叫 Agent Teams,讓一個(gè)主 Agent(Team Lead)可以創(chuàng)建和管理多個(gè)持續(xù)存在的團(tuán)隊(duì)成員(Teammate)。每個(gè)成員有自己的專長、工具集和獨(dú)立的上下文窗口,在各自的空間里并行工作,互不干擾。
你跟主 Agent 說"幫我做一個(gè)電商網(wǎng)站",它會自己拆任務(wù):一個(gè)成員寫后端接口,一個(gè)做前端頁面,一個(gè)寫數(shù)據(jù)庫,一個(gè)跑測試。卡住了向主 Agent 匯報(bào),主 Agent 來協(xié)調(diào)。
你是老板,主 Agent 是項(xiàng)目經(jīng)理,團(tuán)隊(duì)成員是各個(gè)崗位的員工。你只需要跟項(xiàng)目經(jīng)理溝通。
這套東西有多強(qiáng)?Anthropic 安全團(tuán)隊(duì)做過一個(gè)壓力測試:16 個(gè) Claude Opus 4.6 實(shí)例組成一個(gè) Agent Team,在沒有人類干預(yù)的情況下,從零開始用 Rust 寫了一個(gè)能編譯 Linux 內(nèi)核的 C 語言編譯器。花了大約 2 萬美元,跑了將近 2000 個(gè)會話周期,產(chǎn)出了 10 萬行代碼。
16 個(gè) Agent 同時(shí)寫代碼,怎么不打架?
它們用了一個(gè)很聰明的辦法:通過 Git 的文件鎖機(jī)制來"認(rèn)領(lǐng)"任務(wù)。每個(gè) Agent 在開始干活之前,先在代碼倉庫里放一個(gè)鎖文件,聲明"這塊我來"。
Git 天然的防沖突機(jī)制保證了不會有兩個(gè) Agent 同時(shí)改同一個(gè)文件。干完了自己提交代碼、解鎖、去認(rèn)領(lǐng)下一個(gè)任務(wù)。
![]()
不只是 Anthropic 在做
Multi-Agent 不是 Anthropic 一家的事。
Google 聯(lián)合 50 多家企業(yè)推出了 A2A(Agent-to-Agent)協(xié)議,讓不同廠商的 Agent 之間也能互相溝通和協(xié)作。
這意味著你的 Claude Agent 可以跟別人的 GPT Agent 協(xié)同工作,不再局限在一個(gè)生態(tài)里。
加上之前說的 MCP(Agent 連接工具和數(shù)據(jù))和 A2A(Agent 之間互相通信),整個(gè) Agent 世界的"基礎(chǔ)設(shè)施"正在快速成型。
![]()
Git Worktree:同時(shí)試多條路
名詞解釋:Git Worktree Git 是程序員管理代碼版本的工具。Worktree 可以從同一個(gè)代碼起點(diǎn)創(chuàng)建多個(gè)獨(dú)立的工作空間,互不干擾。你可以理解為"平行宇宙"——同一個(gè)項(xiàng)目同時(shí)朝不同方向發(fā)展,最后選最好的那個(gè)。
這個(gè)功能跟 Agent Teams 配合起來很厲害。
比如你要重構(gòu)一個(gè)系統(tǒng)的用戶模塊,但不確定哪種方案最好。
以前你只能先試方案 A,不行再試 B,再不行試 C,串行試錯(cuò),可能花一兩周。
現(xiàn)在你可以用 Git Worktree 創(chuàng)建三個(gè)獨(dú)立的工作空間,每個(gè)空間里放一個(gè) Agent Team,分別按方案 A、B、C 同時(shí)開發(fā)。
三條路同時(shí)走,各自獨(dú)立測試,最后比較結(jié)果選最好的。時(shí)間是以前的三分之一,但探索的可能性是以前的三倍。
某種程度上,你在用并行計(jì)算的方式來做決策。
![]()
主動工作
前面說的 OpenClaw 已經(jīng)提到了定時(shí)機(jī)制。在組織層面,這個(gè)能力的意義更大。
Agent 可以被設(shè)成"值班模式":每隔一段時(shí)間自動檢查代碼倉庫有沒有新的 issue、線上服務(wù)有沒有報(bào)錯(cuò)、數(shù)據(jù)指標(biāo)有沒有異常。發(fā)現(xiàn)問題它會先嘗試自己修,修不了的才通知你。
你晚上 12 點(diǎn)睡覺,Agent 還在跑。早上起來,你收到一份報(bào)告:"昨晚線上有個(gè)接口報(bào)錯(cuò),我查了一下是參數(shù)格式的問題,已經(jīng)修好了,測試通過。另外有一個(gè)新 issue 需要你看一下,我不確定該怎么處理。"
這跟以前的"自動化腳本"不一樣。自動化腳本只能處理你預(yù)設(shè)好的情況,碰到?jīng)]見過的問題就卡住。Agent 有判斷力,能處理意料之外的情況。
![]()
這一層帶來了什么變化
一個(gè)人的產(chǎn)出變成了一個(gè)團(tuán)隊(duì)的產(chǎn)出。
而且這個(gè)團(tuán)隊(duì)有幾個(gè)特點(diǎn)是人類團(tuán)隊(duì)做不到的:全年無休、不用開會對齊、不會理解偏差、可以同時(shí)探索多條路徑、你睡覺的時(shí)候還在干活。
回想一下第一層說的 METR 數(shù)據(jù):AI 能獨(dú)立完成的任務(wù)時(shí)長每幾個(gè)月翻一倍。
當(dāng)這個(gè)時(shí)長從"幾小時(shí)"變成"幾天"甚至"幾周"的時(shí)候,Agent Teams 加上主動工作機(jī)制意味著什么?
你出去度個(gè)假回來,一個(gè)產(chǎn)品的原型可能已經(jīng)做好了。
![]()
第四層:會進(jìn)化了
前面三層說的是 Agent 現(xiàn)在能干什么。但有一個(gè)問題:Agent 能不能越用越強(qiáng)?
之前的答案是不能。
Skills 是人寫的,寫完就固定了。
每次任務(wù)結(jié)束,Agent 積累的經(jīng)驗(yàn)就沒了。
一個(gè) Agent 踩過的坑,另一個(gè) Agent 還得再踩一遍。
EvoMap 和 GEP 協(xié)議在解決這個(gè)問題。
名詞解釋:GEP(基因組進(jìn)化協(xié)議) 一套開放協(xié)議,讓 Agent 的經(jīng)驗(yàn)可以被保存和傳遞。借鑒了生物學(xué)里基因表達(dá)的思路:Agent 做成了一件事,這個(gè)成功的做法會被打包成"基因膠囊",其他 Agent 可以直接繼承,不用自己再摸索一遍。
打個(gè)比方:Skills 像公司發(fā)的員工手冊,寫好了就不變,除非有人去更新。
GEP Gene 像員工在工作中攢下的經(jīng)驗(yàn),會隨著使用不斷調(diào)整,碰到問題能自我修復(fù),長期沒用的會自動淘汰。
一個(gè)真實(shí)的案例:有個(gè)游戲策劃在用 AI 構(gòu)建世界觀的時(shí)候,給 AI 設(shè)了一個(gè)很強(qiáng)的角色人設(shè),結(jié)果 AI 生成的所有名詞都很獨(dú)特,天然避開了命名沖突。
這個(gè)"命名隔離策略"被打包成了基因膠囊。
后來一個(gè)后端工程師的 Agent 在搜索"怎么解決變量命名沖突"的時(shí)候,匹配到了這個(gè)來自游戲領(lǐng)域的膠囊,繼承了底層邏輯,一次就把編譯問題修好了。
解決方案來自一個(gè)完全不相關(guān)的領(lǐng)域。
GEP 是協(xié)議,不是平臺。平臺可以被收購、被關(guān)掉(OpenClaw 被 OpenAI 收購就是個(gè)例子),但協(xié)議是開放的,誰都可以實(shí)現(xiàn)。你的 Agent 攢下的經(jīng)驗(yàn)屬于你。
![]()
這一層帶來了什么變化
以前 100 家公司各自訓(xùn)練 Agent 解決同一個(gè)問題,總成本上萬美元。
現(xiàn)在一個(gè) Agent 解決了,其他 99 個(gè)花幾美分繼承經(jīng)驗(yàn)。Agent 用得越多,整個(gè)網(wǎng)絡(luò)就越強(qiáng)。
四層疊在一起
單看每一層都是明顯的進(jìn)步。但四層疊在一起,效果是乘出來的:
- 第一層:每個(gè) Agent 的產(chǎn)出質(zhì)量接近人類專家
- 第二層:每個(gè) Agent 能用的工具和能力覆蓋好幾個(gè)職能
- 第三層:多個(gè)這樣的 Agent 同時(shí)干活,全天候運(yùn)轉(zhuǎn)
- 第四層:所有 Agent 的經(jīng)驗(yàn)可以沉淀、傳遞、進(jìn)化
2025 年,你有一個(gè)聰明的對話伙伴,但它困在文本框里。你問一句它答一句,剩下的事你自己干。
2026 年初,你有一個(gè)團(tuán)隊(duì)。你描述你想要什么,剩下的事它們?nèi)ジ伞?/p>
寫代碼、做設(shè)計(jì)、跑測試、剪視頻、操作手機(jī)應(yīng)用,甚至能通過車去物理世界辦事。
它們同時(shí)探索多條路,自己判斷質(zhì)量,你睡覺的時(shí)候還在干,而且經(jīng)驗(yàn)會不斷積累。
![]()
我一周做出大廠一個(gè)月的產(chǎn)品,不是因?yàn)槲冶人麄兟斆鳌?/p>
是因?yàn)檫@四層杠桿疊在一起:
模型夠強(qiáng)所以質(zhì)量不打折,工具夠多所以不用找設(shè)計(jì)師和運(yùn)維,組織夠好所以多條線同時(shí)推進(jìn)不用開站會,經(jīng)驗(yàn)?zāi)軅鞒兴圆挥脧牧汩_始。
還有哪些問題沒解決
管 Agent 這件事本身就很難
5 個(gè) Agent 同時(shí)跑,你就有 5 份結(jié)果要驗(yàn)收。
每份涉及不同領(lǐng)域,你得在代碼、設(shè)計(jì)、文案之間來回切換。
Token 消耗也容易失控。
Agent 可能在一個(gè)方向上探索半天,最后發(fā)現(xiàn)走不通。你不盯著就浪費(fèi)錢,盯著就變成全職監(jiān)工,自己什么都干不了。
GitHub 前 CEO Thomas Dohmke 離職創(chuàng)辦了一家叫 Entire 的公司,就在做這件事:把代碼、意圖、推理過程統(tǒng)一到一個(gè)版本控制系統(tǒng)里,讓你能追蹤每個(gè) Agent 干了什么、為什么這么干。
管 Agent 的工具本身就是一個(gè)很大的產(chǎn)品方向。
安全和信任
Agent 能操作你的電腦、讀你的文件、替你發(fā)消息、替你部署代碼。
權(quán)限越來越大,但什么操作需要你確認(rèn)、什么可以自動執(zhí)行,這條線怎么畫,整個(gè)行業(yè)還沒想清楚。
Agent 的經(jīng)濟(jì)身份
Agent 能替你花錢(消耗 Token、調(diào)用付費(fèi) API),也能替你賺錢(接懸賞任務(wù)、貢獻(xiàn)基因膠囊獲得積分)。
但它沒有銀行賬戶,沒有身份認(rèn)證。誰為它的行為負(fù)責(zé)?收益歸誰?Agent 之間怎么結(jié)算?
這些基礎(chǔ)設(shè)施還不存在。
![]()
這些變化落到現(xiàn)實(shí)里會怎樣
公司會變小
以前做一個(gè)產(chǎn)品的標(biāo)準(zhǔn)配置:產(chǎn)品經(jīng)理、設(shè)計(jì)師、前端、后端、測試、運(yùn)維、項(xiàng)目經(jīng)理。
一個(gè)功能從想法到上線,六七個(gè)角色,無數(shù)次會議。
現(xiàn)在一個(gè)人加 Agent 就能把這些活都干了。Agent 之間不用開會,不會理解偏差,不會請假。
OpenClaw 就是個(gè)例子。一個(gè)人的周末項(xiàng)目,3 個(gè)月拿了 20 萬 GitHub Star,然后被 OpenAI 收購。
你養(yǎng) 50 人團(tuán)隊(duì),對手 3 個(gè)人加一堆 Agent,成本是你的十分之一,速度是你的五倍。這個(gè)賬很好算。
教育跟不上了
你花四年學(xué)的技能,畢業(yè)前可能就被 Agent 學(xué)會了。
AI 能力每 4 到 7 個(gè)月翻一倍,2026 年入學(xué)的大學(xué)生到 2030 年畢業(yè)時(shí),AI 的能力可能翻了 8 到 16 倍。
更麻煩的是,現(xiàn)在的教育訓(xùn)練的是"執(zhí)行能力":
學(xué)一門技術(shù)、掌握一套方法、按規(guī)范完成任務(wù)。
但 Agent 時(shí)代需要的是"判斷能力":
什么問題值得解決、哪個(gè)方案更好、不確定的時(shí)候怎么決策。
這兩種能力的培養(yǎng)方式完全不同,現(xiàn)在的教育體系幾乎只圍繞前者設(shè)計(jì)。
中間層最難受
頂層的人有資源、有判斷力,會拿到最大的杠桿。
底層做體力活的人,短期內(nèi)反而相對安全,因?yàn)?Agent 還沒有身體(雖然車正在改變這一點(diǎn))。
最難受的是中間層。
大廠白領(lǐng)、中層管理、普通知識工作者。工作最容易被替代,但認(rèn)知和技能又不夠快速轉(zhuǎn)型成"Agent 指揮官"。
Amodei 在他的文章里專門聊了這個(gè)。
他說以前的技術(shù)革命,被替代的人可以轉(zhuǎn)行到相鄰領(lǐng)域,農(nóng)民去工廠,工人去辦公室。
但 AI 在所有認(rèn)知領(lǐng)域同時(shí)進(jìn)步,你轉(zhuǎn)行去學(xué)的新東西,AI 也在同步變強(qiáng)。
內(nèi)容會重新洗牌
以前做內(nèi)容是手藝活,寫文章、做視頻、做設(shè)計(jì),每樣都需要專業(yè)技能和大量時(shí)間。
現(xiàn)在 Agent 能寫文章,Nano Banana Pro 能做設(shè)計(jì),Seedance 2.0 能拍視頻。內(nèi)容的生產(chǎn)成本在快速下降。
當(dāng)所有人都能用 Agent 生產(chǎn)內(nèi)容的時(shí)候,"能做"就不值錢了。值錢的是知道該做什么。
品味、判斷力、獨(dú)特的視角,這些東西 Agent 暫時(shí)還給不了你。
如果你的價(jià)值是"能寫能拍能設(shè)計(jì)",壓力會很大。
如果你的價(jià)值是"知道什么值得寫、值得拍、值得設(shè)計(jì)",Agent 反而給了你杠桿,你的一個(gè)想法可以被快速變成成品。
國家之間的牌也會重新洗
知識經(jīng)濟(jì)時(shí)代,人口素質(zhì)決定國力。Agent 時(shí)代,能源效率決定國力。
有廉價(jià)能源就有廉價(jià)算力,有廉價(jià)算力就有廉價(jià)智能。以前發(fā)展中國家靠廉價(jià)勞動力參與全球分工,現(xiàn)在 Agent 比人工更便宜、更快、質(zhì)量更穩(wěn)定。這個(gè)比較優(yōu)勢可能會很快消失。
![]()
你可以做什么
用起來,用最好的:
花 20 甚至 200 美金訂閱 Claude Code 或 ChatGPT 的付費(fèi)版。
免費(fèi)版比付費(fèi)版落后很多,拿免費(fèi)版來判斷 AI 的水平,就像拿翻蓋手機(jī)評價(jià)智能手機(jī)。
不要只拿它聊天。把它塞進(jìn)你的實(shí)際工作里:
做運(yùn)營的丟數(shù)據(jù)給它找規(guī)律,做內(nèi)容的讓它幫你調(diào)研和起草,做產(chǎn)品的讓它寫需求文檔和競品分析。從你每天花時(shí)間最多的那件事開始試。
如果一個(gè)模型今天在某件事上表現(xiàn)出了一點(diǎn)苗頭,下一代就會真正擅長。進(jìn)步是指數(shù)級的。
理解 Agent 體系,不只是"用 AI"。 "用 ChatGPT"和"用 Agent 體系"是兩回事。
前者是問答,后者是讓 AI 替你干活。
試著了解 Claude Code 和 Openclaw 怎么工作的:
MCP 和 Skills 是什么,CLAUDE.md 和 SOUL.md 這套本地文檔體系意味著什么。
你不用成為開發(fā)者,但你得理解這套東西的邏輯。
就像你不用會寫代碼,但你得理解互聯(lián)網(wǎng)怎么運(yùn)作,才能在互聯(lián)網(wǎng)時(shí)代做好工作。
想清楚你的價(jià)值在哪:
Amodei 說得很直接:AI 不是替代某一種技能,它在所有認(rèn)知方向上同時(shí)進(jìn)步。
以前的技術(shù)革命是窄的,AI 是寬的。
你的價(jià)值得往上遷移。從"親自執(zhí)行"到"定義問題和判斷質(zhì)量",從"我能做什么"到"我能讓 Agent 做什么"。
Agent 能把想法變成現(xiàn)實(shí),但它自己不會產(chǎn)生想法。
別等了:
很多人在等,等 AI 更成熟、等有人教、等公司安排培訓(xùn)。
但這個(gè)領(lǐng)域幾個(gè)月就變一次。你等的每一天,差距都在拉大。
Amodei 說過,速度本身不意味著勞動力市場不會恢復(fù),但短期的過渡會很痛苦。
你沒法改變技術(shù)進(jìn)步的速度,但你可以選擇自己站在哪一邊。
![]()
在 AI 上花的錢是投資。 智能第一次可以被大規(guī)模生產(chǎn)了,限制它的是能源和算力。
你愿意在 AI 上投入多少 Token,直接影響你的產(chǎn)出質(zhì)量。
用頂級模型和用免費(fèi)模型的人,一年后的差距會很大。
最后
Amodei 把我們這個(gè)階段比作技術(shù)的"青春期"。我覺得這個(gè)比喻挺準(zhǔn)的。
青春期的特點(diǎn)就是變化快、能量大、方向不確定,而且不管你準(zhǔn)備好了沒有,它都會來。
我能做的就是把我看到的東西盡量拆清楚。
你看完之后覺得有道理,就開始動手試試。
覺得跟你沒關(guān)系,那也行,至少你知道了。
如果你身邊有人應(yīng)該了解這些變化但還不知道,把這篇轉(zhuǎn)給他們。
大多數(shù)人不會主動去了解這些東西,但他們值得有機(jī)會提前準(zhǔn)備。
![]()
引用:
隆重推出 Nano Banana Pro:https://blog.google/intl/zh-tw/products/explore-get-answers/nano-banana-pro/
Automate workflows with hooks:https://code.claude.com/docs/zh-CN/hooks-guide
Connect Claude Code to tools via MCP:https://code.claude.com/docs/zh-CN/mcp
Extend Claude with skills:https://code.claude.com/docs/zh-CN/skills
Orchestrate teams of Claude Code sessions:https://code.claude.com/docs/zh-CN/agent-teams
The Adolescence of Technology:https://www.darioamodei.com/essay/the-adolescence-of-technology
Claude Opus 4.6 隆重登場:https://www.anthropic.com/news/claude-opus-4-6
GPT?5.3?Codex 正式登場:https://openai.com/zh-Hans-CN/index/introducing-gpt-5-3-codex/
我們,已邁過奇點(diǎn):https://mp.weixin.qq.com/s/aSLr9hWAlIJ-KhsVmSHqUA?scene=1
Something Big Is Happening-大事將至:https://x.com/mattshumer_/status/2021256989876109403
互聯(lián)網(wǎng)已死,Agent 永生:https://mp.weixin.qq.com/s/cX3bYrI9Sq7sOJj0E6V9IQ
Openclaw:https://docs.openclaw.ai/zh-CN
Agent 原生通訊協(xié)議:從傳遞代碼,到傳遞認(rèn)知:https://mp.weixin.qq.com/s/6ppTHXXdmKWI18uB_ysf3w
EvoMap 誕生記:從平臺依賴到進(jìn)化協(xié)議:https://evomap.ai/blog/evomap-origin-story
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.