![]()
編輯|冷貓
我確實對運行 OpenClaw 持相當懷疑的態(tài)度。…… 整個生態(tài)給人的感覺就像是一個徹底的狂野西部,在安全性上簡直是一場噩夢。 —— Andrej Karpathy
OpenClaw 這只龍蝦,徹底從開發(fā)者和科技愛好者的小圈子里跳出來了。
從 Clawdbot 誕生至今,其在 Github 上已狂攬 352k stars,超越 Linux 與 ReAct ,飛漲速度令人瞠目結舌。
![]()
放眼望去,站在 AI 前沿的各大互聯網大廠,手機廠商,甚至就連谷歌、英偉達等海外科技巨頭,無一缺席,紛紛發(fā)布部署 OpenClaw 的相關產品或是相關工作。
各種 OpenClaw 類的「龍蝦」工具,和目前已經相當成熟的智能體最大的不同,其實是與社交媒體和實時通訊工具的無縫融合。
這只龍蝦滿足了人們對于「智能體」時代的想象:發(fā)一條消息,遠在千里之外的人工智能就能幫你把活搞定。
全民養(yǎng)龍蝦的熱潮,真正是一堂認知課,讓每一個普通人都意識到了 AI 圈子里早些日子認知到的一個事實:AI 已經進入了「自主執(zhí)行時代」。
AI 進入「自主執(zhí)行時代」
在 OpenClaw 這類的自治 Agent 系統爆火之后,人們第一次如此直觀地感受到:AI 的角色正在發(fā)生根本變化。
![]()
早期的 LLM Agent 主要依賴 Prompt、知識檢索和簡單工具調用,本質仍然是對話助手;隨后出現的 Workflow Agent 引入了流程編排和任務自動化,模型可以根據預設流程完成復雜操作;而在最新一代 Agentic Agent 架構中,智能體可以自主規(guī)劃任務、動態(tài)調用工具并持續(xù)與環(huán)境交互。
![]()
換句話說,AI 正在從「聊天助手」走向「數字員工」,這也是智能體最具魅力的地方。
但硬幣總有第二面。我們前段時間做過相關的報道,給「龍蝦熱」狠狠潑上一盆冷水。
簡單來說,就是在工作中使用智能體時候,最經典的「rm -rf」操作頻頻上演。有刪除 D 盤文件的,刪除社交賬號記錄的,這種問題就連 Meta 超級智能安全總監(jiān)都中招了。
![]()
另外,如果一個智能體可以執(zhí)行代碼、訪問網頁甚至調用系統命令,那么它本身就會成為新的攻擊入口。也有案例,員工私自在公司電腦上安裝 OpenClaw,導致把機器掛到了公網,被黑客入侵了整個公司內網。
也難怪 Karpathy 發(fā)出了本文開頭的感慨。本質上來說,Agent 缺少可控的「安全執(zhí)行邊界」、身份認證、權限管理,亟需一個可控的執(zhí)行環(huán)境和隔離機制。
而安全問題只是其中之一。我們知道,Agent 的任務往往具有一些非常典型的特點:生命周期短,并且?guī)в猩舷挛臓顟B(tài)。
很多 Agent 執(zhí)行任務的時間只有幾秒到幾分鐘,用完即銷毀,同時系統可能在瞬間創(chuàng)建大量執(zhí)行環(huán)境。然而傳統云計算架構主要是為長期運行的服務設計的,就會出現資源利用率低、冷啟動慢以及成本高的問題。
也就是說,Agent 的會話性、上下文敏感、極致彈性的資源架構,決定了需要更加靈活的服務資源支撐。
第三個挑戰(zhàn)來自并發(fā)規(guī)模。Agent 的并發(fā)規(guī)模遠遠超過普通應用。尤其是在強化學習訓練中,每一個智能體都需要一個獨立環(huán)境進行交互,需要海量的并發(fā)環(huán)境來實現。這對底層基礎設施提出了極高要求。
本質上,我們需要一個輕量級、快速啟動、可水平擴展的執(zhí)行環(huán)境來承載智能體所需的高并發(fā)任務。
實話說,目前的智能體及其執(zhí)行環(huán)境正處于一個野蠻生長的階段。據我們了解,行業(yè)內執(zhí)行環(huán)境 API 形態(tài)繁雜,至少存在十幾種不同的智能體協議。
缺少一個強有力的協議標準的情況下,智能體基礎設施在多云以及跨平臺的可移植性和規(guī)模化落地上形成了無形的巨大阻力。
護航企業(yè)「龍蝦類」智能體的基礎設施
這正是各大云服務和 AI Infra 廠商正在考慮的問題,讓 AI 擁有一個可控、可管理、高效執(zhí)行的空間,是智能體「自主執(zhí)行時代」的兵家必爭之地。
我們發(fā)現,騰訊不僅在養(yǎng)龍蝦這件事上上心,更要在 AI Infra 領域深度擁抱智能體時代。
![]()
騰訊云云原生產品副總經理、騰訊云專家工程師 Gary認為「AI agent 的這一次的變化,改變企業(yè)的形態(tài)、改變社會的形態(tài)、改變組織的形態(tài)、改變軟件的形態(tài)、改變用云的角色的形態(tài)。」
為此,騰訊云 Agent Runtime 深度洞察企業(yè)核心訴求,為企業(yè)級 AI 智能體應用打造了全方位的專業(yè)支持,助力企業(yè)高效構建智能化能力。
騰訊云 Agent Runtime 的解決方案包含瀏覽器、code 執(zhí)行、手機、電腦等豐富的沙箱類型,提供全鏈路安全、Agent 原生資源架構、極致彈性與生態(tài)兼容的能力,實現極速啟動和十萬級實例并發(fā)開箱即用的領先特性,讓 Agent 在企業(yè)應用中具備安全、可靠的執(zhí)行環(huán)境。
![]()
作為 AI Agent 走向產業(yè)化的核心驅動力,騰訊云 Agent Runtime 已成為支撐騰訊內部及多家國內頭部大模型企業(yè)的關鍵基礎設施。
目前,該平臺已穩(wěn)健托管數十萬個 Agent 實例,能夠完美補齊企業(yè)級場景所需的可用性、安全性與可治理性,打通了從開源框架到生產力工具的「最后一公里」。
開發(fā)者們選擇騰訊云 Agent Runtime 很重要的原因,是其開箱即用的省心特性。騰訊云 Agent Runtime 解決了以 OpenClaw 為代表的這類自主智能體,在企業(yè)級部署中最令人頭疼的兩大問題:
Agent 狀態(tài)管理
我們知道,Agent 和普通服務不一樣,會在運行過程中不斷留下狀態(tài),并且大部分時候處于等待任務的狀態(tài)。
如果讓它常駐運行,高昂的成本讓企業(yè)難以承受;如果隨用隨啟,Agent 在運行過程中積累的上下文、工具鏈產物和環(huán)境配置就會隨著容器的銷毀而化為烏有。
Agent Runtime 的核心突破在于實現了狀態(tài)與算力的解耦。沒請求時暫停實例、釋放算力;有請求時自動恢復,整個文件系統原樣保留。這樣一來,Agent 空閑時可以停,干活時又能從上次的狀態(tài)接著干。
在這個基礎上,Agent Checkpoint也就成了自然能力。一個已經調教好的 Agent,可以在任意時刻做快照,后續(xù)用來恢復、回滾,或者直接克隆出更多實例,讓已經積累下來的經驗和能力可以復制、繼承。
Agent 行為治理
Agent 擁有編寫代碼和調用接口的能力,這賦予了它極高的生產力,但也帶來了巨大的行為管理難題。企業(yè)要讓它們運行在可控、可審計的邊界里。
Agent Runtime 會對所有 Agent 都進行嚴格的隔離。每個 Agent 實例都運行在獨立的 VM 級安全沙箱里。這樣即使某個實例被攻破或者出了異常問題,影響也只會停留在它自己身上,不會影響其他實例或平臺。
對外訪問及本地敏感操作統一治理。Agent 發(fā)起外部請求時,憑證不保存在實例里,而是由 Gateway 按需注入、用完即銷毀,做到實例本地零憑證;權限由網關統一控制、統一審計;刪除資源、修改權限、發(fā)起外部請求這類高危操作,還可以配置審批或攔截規(guī)則。
這套方案的本質,是 AI Infra 的能力基礎,承托起 Agent 業(yè)務的靈活高效。這一架構沒有試圖通過限制「龍蝦」的感知和行動來換取安全,反而為企業(yè)補齊了安全、治理與運營的基礎設施。
不懼變動的數據資產
Agent 在運行中沉淀三類資產:技能(Skill)、記憶(Memory)、協作關系
三類資產從第一天起就獨立于框架存儲和管理。Skill 以制品形式入庫,版本管理、權限管控,任意實例可引用;Memory 從本地同步上云,跨實例共享,新 Agent 繼承老 Agent 的經驗;Agent 之間通過 Gateway 做服務發(fā)現和路由,協作在平臺層編排,不依賴框架私有協議。
Agent 框架可能會更新、會被替代,但 Agent 們積累的數據不會過時。知識與技能永遠留在企業(yè)內部,不跟著個人走,也不跟著框架走,最終轉化為企業(yè)的生產資料。
迎接智能生產力
AI 進入企業(yè),發(fā)生變化的不會只有技術。流程、分工、權限、成本,都會跟著進行進化。
Agent Runtime 的核心使命,是為企業(yè)提供一套全局視角的「AI 員工」管理模式,讓組織能夠接得住、管得好這股新型生產力。
Agent Runtime 服務于企業(yè)對全局 Agent 的技能、行為、權限和成本的管控:平臺團隊先把 skill、初始化腳本、鏡像和配置封裝成模板,統一化管理任意開源或自建 Agent 在內部的創(chuàng)建和版本變更;再通過策略管控所有 Agent 的工具調用、數據訪問、LLM 調用等行為執(zhí)行邊界;還可以通過 token 額度管理實例、用戶和組織三層的成本消耗。
在騰訊云 Agent Runtime 的加持下,龍蝦不再難以馴服,能夠成為在企業(yè)復雜網絡環(huán)境中縱橫馳騁、安全合規(guī)的高產工具,成為了企業(yè) AI 轉型的第一步
業(yè)界最強性能亮相,Minimax 用上也「真香」
隨著 AI 演進從簡單的「會話」跨越到「動態(tài)交互」,Agentic RL(智能體強化學習) 已成為通往 AGI 的必經之路。
如果說大模型的「大腦」是通過海量文本喂養(yǎng)出來的,那么真正具備自主靈魂的智能體,則是通過在真實環(huán)境中的「摸爬滾打」練就的。
Agent RL 最大區(qū)別就是需要和環(huán)境交互,交互好壞影響訓練效率和效果。這種交互一般是在沙箱中執(zhí)行的,因此沙箱是強化學習的「命門」,是決定 Agent 進化速度與天花板的核心基礎設施
![]()
騰訊云 Agent Runtime 作為最前沿的智能體基礎設施技術突破,在今年的英偉達 GTC 大會上亮相。
![]()
在 GTC 大會上,騰訊云團隊提出,Agent RL 將帶給沙箱的挑戰(zhàn)推向了極致:需要訓練、推理、環(huán)境交互與系統復雜性的四重疊加
![]()
騰訊云 Agent Runtime 智能體沙箱在 GTC 的亮相,吸引了全球開發(fā)者的目光。沙箱已從單純的安全組件,進化為 Agent 時代的「基礎設施一等公民」 。通過 Agent-Native 的設計理念,它正為全球開發(fā)者提供一個更安全、更高效、更具擴展性的 Agent 進化搖籃。
毫秒級啟動,十萬級并發(fā),MiniMax 高性能穩(wěn)定落地
還記得過年前后,那個溫暖打工人錢包的 1 美元時薪大模型 MiniMax M2.5 嗎?
一個 10 B 參數量的全能選手,在多語言任務 Multi-SWE-Bench 上拿下了行業(yè)第一;在 SWE-Bench Verified 評測集上,基于 Droid 和 OpenCode 的實戰(zhàn)測試中,它的通過率(79.7% / 76.1%)雙雙超越 Opus 4.6。
而鮮為人知的是,MiniMax 與騰訊云在 Agent RL 場景下進行了合作,在騰訊云 Agent Runtime 的強大性能的基礎上,突破了現實世界的智能體 RL 的「不可能三角」:平衡系統吞吐量、訓練穩(wěn)定性和智能體靈活性。
![]()
MiniMax Forge 架構圖
交互環(huán)境的并發(fā)、彈性和質量直接決定了模型訓練的效率和效果。
- 極致性能響應: 實現 80ms 極速啟動與 P99 延遲小于 1 秒 ,確保 Agent 在復雜任務中獲得近乎實時的交互反饋。
- 海量并發(fā)能力: 支持每分鐘十萬級沙箱實例的并發(fā)創(chuàng)建與瞬時銷毀,實現 99.99% 的穩(wěn)健成功率。
- 分發(fā)加速架構: 憑借「鏡像去重 + 多級緩存 + 加速中心」的三位一體技術,實現數十萬鏡像的分發(fā)加速。
- 全場景環(huán)境模擬: 深度覆蓋代碼、瀏覽器、手機及桌面端全平臺環(huán)境,原生適配 SWE-bench 與 OSWorld 等主流 Agent 評測標準。
- 原生開發(fā)生態(tài): 提供兼容 E2B 協議的開源 SDK、API 及完整工具鏈,深度集成主流訓練框架以實現無縫遷移。
依托騰訊云提供的 Agent Runtime 沙箱服務,MiniMax 實現了強化學習場景中大規(guī)模交互環(huán)境的毫秒級拉起、十萬級并發(fā)、瞬時銷毀,大幅提升了并發(fā) Rollout 的訓練吞吐量和穩(wěn)定性,更為模型在系統終端的自主試錯構建了安全邊界。
在性能方面,騰訊云 Agent Runtime 在單個鏡像(如 Code Interpreter)場景下,大規(guī)模并發(fā)啟動沙箱,最大可以支持每分鐘 60 萬沙箱創(chuàng)建,QPS 可以達到 1 萬以上,整體P99 延遲控制在 1 秒左右。因為整體架構沒有單點依賴,整體系統仍然可以橫向擴展。
![]()
![]()
在 SWE RL 場景下 Agent Runtime 沙箱的壓測效果可以達到16 萬 QPM 的吞吐,P99 延遲控制在 1 秒以內,成功率達 99.99%。這仍然不是 Agent Runtime 沙箱的并發(fā)上限,系統支持便捷橫向擴容。
![]()
MiniMax 與騰訊云的深度技術共建,有效突破了傳統架構在大規(guī)模并發(fā)、極速啟動上的能力瓶頸。
MiniMax 的 Agent 首席架構師阿島說,目前 Agent 已經能夠自主地驅動很大部分的 agentic RL 過程,但「這里面最有可能卡住的就是沙箱的環(huán)節(jié),(如果任意環(huán)節(jié)卡住)就會極大的影響我的模型的迭代,如果迭代速度慢了,那可能和別的模型相比,我的競爭力就會受到影響。」
在如此白熱化的激烈競爭態(tài)勢下,Minimax 與騰訊云 Agent Runtime 的協作,從輕量級調度、極致存儲優(yōu)化,到全場景的真實環(huán)境模擬,這套 Agent Infra 方案,為強化學習框架提供了一個極致彈性、可持續(xù)擴展的生產級試驗場,對 Minimax 保持強勢的競爭力至關重要。
結語:在狂野西部,建立文明的邊界
我們獲悉,騰訊云 Agent Runtime 底層平臺 Cube 將全面開源,企業(yè)可直接用于智能體訓練和部署。
如果說 OpenClaw 的爆火象征著 AI 開發(fā)者們在「狂野西部」的一次集體沖鋒,那么騰訊云 Agent Runtime 的出現,則標志著這場運動開始從無序走向秩序與成熟。
過去我們習慣于討論模型的參數量、推理能力或是多模態(tài)性能,但在「自主執(zhí)行時代」,這些只是智能體的「大腦」。正如 Karpathy 所擔憂的那樣,沒有安全邊界和性能保障的智能體,很可能是數字世界混亂的源頭。
騰訊云 Agent Runtime,第一次為這群「數字員工」提供了一個既能自由探索、又絕對可控的「數字化工位」。
基礎設施的演進往往滯后于應用層爆發(fā),但它決定了應用能走多遠。當毫秒級的冷啟動、容器級的安全隔離以及標準化的執(zhí)行協議成為標配,智能體才真正具備了大規(guī)模進入產業(yè)生產線的資格。
騰訊云 Agent Runtime 正在成為智能體時代的「調度中心」,更是智能體自我學習,通往 AGI 閉環(huán)過程中,不可或缺的一塊拼圖。
這只從圈子里「跳出來」的龍蝦,終于在云端找到了它最穩(wěn)健的棲息地,也找到了它通往自我進化的快車道。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.