![]()
2026年1月底,一個(gè)開(kāi)源項(xiàng)目在GitHub上7天斬獲10萬(wàn)星。不是新模型,不是新框架,而是一個(gè)叫OpenClaw的"個(gè)人AI代理"——它能幫你干ChatGPT死活干不了的事:查話(huà)費(fèi)、和保險(xiǎn)扯皮、跨WhatsApp和Slack追deadline。
開(kāi)發(fā)者AJ Stuyvenberg用它談下一輛車(chē)的價(jià)格,省了4200美元。方法很樸素:讓代理接管郵箱,跟經(jīng)銷(xiāo)商來(lái)回磨了幾天。
有人叫它"長(zhǎng)了手的Claude"。這個(gè)比喻流傳很廣,也錯(cuò)得很離譜。
OpenClaw的本質(zhì)不是給聊天機(jī)器人接幾只機(jī)械臂,而是把生產(chǎn)級(jí)AI代理的完整架構(gòu)攤開(kāi)了給你看。搞懂它,你就搞懂了現(xiàn)在所有agentic系統(tǒng)的運(yùn)作邏輯。
三層架構(gòu):消息怎么變成行動(dòng)
大多數(shù)人裝OpenClaw是想要個(gè)更聰明的聊天工具。實(shí)際到手的,是一個(gè)跑在本地或VPS上的網(wǎng)關(guān)進(jìn)程。它把你日常用的通訊平臺(tái)串成一張網(wǎng),每條消息都塞進(jìn)一個(gè)LLM驅(qū)動(dòng)的運(yùn)行時(shí)——這個(gè)運(yùn)行時(shí)真的能對(duì)外部世界動(dòng)手。
WhatsApp、Telegram、Slack、Discord、Signal、iMessage、WebChat,全部連進(jìn)同一個(gè)Gateway。你在WhatsApp發(fā)語(yǔ)音,在Slack打字,面對(duì)的是同一個(gè)代理。它記得你兩分鐘前在另一個(gè)平臺(tái)說(shuō)過(guò)什么。
代理的指令、性格、工具連接,全寫(xiě)進(jìn)三份配置文件:SOUL.md定義身份,USER.md交代你的背景,AGENTS.md劃定行為邊界。沒(méi)有圖形界面,純文本,像給新員工寫(xiě)入職手冊(cè)。
消息進(jìn)來(lái)后要走完七步:渠道標(biāo)準(zhǔn)化→路由與會(huì)話(huà)序列化→上下文組裝→模型推理→ReAct循環(huán)→按需加載技能→記憶持久化。ReAct那一步是關(guān)鍵——代理自己決定"想→做→觀察→再想"的循環(huán)次數(shù),直到任務(wù)閉環(huán)。
工具層:MCP協(xié)議與瀏覽器自動(dòng)化
代理要干活,得接外部服務(wù)。OpenClaw用MCP(模型上下文協(xié)議)打通這些連接。一個(gè)MCP server就是一塊樂(lè)高,插上去就能調(diào)API、讀數(shù)據(jù)庫(kù)、操作瀏覽器。
瀏覽器任務(wù)是最直觀的例子。你說(shuō)"幫我訂下周去上海的機(jī)票",代理會(huì):打開(kāi)航司網(wǎng)站→搜索航班→對(duì)比價(jià)格→填你的常旅客信息→ hold住座位→截圖發(fā)你確認(rèn)。全程在隔離的瀏覽器實(shí)例里跑,你能看到它點(diǎn)了什么、卡在哪一步。
技能是按需加載的。代理不會(huì)啟動(dòng)就背下所有工具文檔,而是推斷"現(xiàn)在需要查日歷",然后去調(diào)對(duì)應(yīng)的MCP server。省token,也省上下文窗口的噪音。
安全:自己托管的代價(jià)
OpenClaw的安全設(shè)計(jì)很"舊派"——默認(rèn)不信任任何一層。網(wǎng)關(guān)綁定localhost,外網(wǎng)流量進(jìn)不來(lái);token認(rèn)證強(qiáng)制開(kāi)啟,沒(méi)有匿名訪(fǎng)問(wèn);文件權(quán)限鎖死,代理能讀哪些目錄寫(xiě)進(jìn)白名單。
群聊行為要單獨(dú)配置。你可以讓代理只在被@時(shí)回應(yīng),或者完全忽略群組消息。否則把代理拉進(jìn)50人的工作群,它會(huì)被@到token破產(chǎn)。
最頭疼的是"引導(dǎo)問(wèn)題"(bootstrap problem):代理需要憑證才能登錄你的服務(wù),但這些憑證存在哪?OpenClaw的解法是本地加密存儲(chǔ)+啟動(dòng)時(shí)手動(dòng)解鎖。沒(méi)有云托管的密碼管理器,也沒(méi)有"一鍵同步所有賬號(hào)"的魔法。
提示詞注入是另一個(gè)雷區(qū)。攻擊者如果能在你讓代理處理的郵件里塞指令,理論上可以劫持代理行為。OpenClaw的防御很務(wù)實(shí):社區(qū)技能必須經(jīng)過(guò)人工審計(jì)才能進(jìn)官方倉(cāng)庫(kù),運(yùn)行時(shí)還有一層行為沙箱——代理想刪文件或?qū)ν廪D(zhuǎn)賬,會(huì)觸發(fā)二次確認(rèn)。
安全審計(jì)工具是內(nèi)置的。跑一遍能列出所有暴露的攻擊面:哪些MCP server有網(wǎng)絡(luò)權(quán)限、哪些文件路徑可讀、代理的system prompt有沒(méi)有被用戶(hù)消息污染的風(fēng)險(xiǎn)。
為什么是現(xiàn)在
AJ Stuyvenberg那4200美元的案例之所以出圈,是因?yàn)樗疗屏艘粋€(gè)幻覺(jué):我們以為AI代理需要多復(fù)雜的規(guī)劃能力,其實(shí)很多時(shí)候只是"持續(xù)跟進(jìn)"——在正確的時(shí)間發(fā)正確的郵件,記住三天前經(jīng)銷(xiāo)商說(shuō)過(guò)什么,不被已讀不回搞崩心態(tài)。
OpenClaw的代碼量不算大,但每一行都在回答"生產(chǎn)級(jí)代理長(zhǎng)什么樣"。它不是demo,是跑在真實(shí)開(kāi)發(fā)者機(jī)器上的基礎(chǔ)設(shè)施。100,000顆GitHub星里,有多少人會(huì)真的部署?不知道。但至少現(xiàn)在,想親手搭一個(gè)的人有了完整的圖紙。
你會(huì)讓一個(gè)代理接管你的郵箱去談判嗎?如果省了4200美元,但全程不知道它具體發(fā)了什么——這筆賬怎么算?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.