網易首頁 > 網易號 > 正文申請入駐

全行業(yè)的「龍蝦熱」中，什么是AI Infra下半場的「神之一手」？

2026-04-08 18:04:47　來源: 機器之心Pro

北京舉報

分享至

編輯｜冷貓

我確實對運行 OpenClaw 持相當懷疑的態(tài)度。…… 整個生態(tài)給人的感覺就像是一個徹底的狂野西部，在安全性上簡直是一場噩夢。 —— Andrej Karpathy

OpenClaw 這只龍蝦，徹底從開發(fā)者和科技愛好者的小圈子里跳出來了。

從 Clawdbot 誕生至今，其在 Github 上已狂攬 352k stars，超越 Linux 與 ReAct ，飛漲速度令人瞠目結舌。

放眼望去，站在 AI 前沿的各大互聯網大廠，手機廠商，甚至就連谷歌、英偉達等海外科技巨頭，無一缺席，紛紛發(fā)布部署 OpenClaw 的相關產品或是相關工作。

各種 OpenClaw 類的「龍蝦」工具，和目前已經相當成熟的智能體最大的不同，其實是與社交媒體和實時通訊工具的無縫融合。

這只龍蝦滿足了人們對于「智能體」時代的想象：發(fā)一條消息，遠在千里之外的人工智能就能幫你把活搞定。

全民養(yǎng)龍蝦的熱潮，真正是一堂認知課，讓每一個普通人都意識到了 AI 圈子里早些日子認知到的一個事實：AI 已經進入了「自主執(zhí)行時代」。

AI 進入「自主執(zhí)行時代」

在 OpenClaw 這類的自治 Agent 系統爆火之后，人們第一次如此直觀地感受到：AI 的角色正在發(fā)生根本變化。

早期的 LLM Agent 主要依賴 Prompt、知識檢索和簡單工具調用，本質仍然是對話助手；隨后出現的 Workflow Agent 引入了流程編排和任務自動化，模型可以根據預設流程完成復雜操作；而在最新一代 Agentic Agent 架構中，智能體可以自主規(guī)劃任務、動態(tài)調用工具并持續(xù)與環(huán)境交互。

換句話說，AI 正在從「聊天助手」走向「數字員工」，這也是智能體最具魅力的地方。

但硬幣總有第二面。我們前段時間做過相關的報道，給「龍蝦熱」狠狠潑上一盆冷水。

簡單來說，就是在工作中使用智能體時候，最經典的「rm -rf」操作頻頻上演。有刪除 D 盤文件的，刪除社交賬號記錄的，這種問題就連 Meta 超級智能安全總監(jiān)都中招了。

另外，如果一個智能體可以執(zhí)行代碼、訪問網頁甚至調用系統命令，那么它本身就會成為新的攻擊入口。也有案例，員工私自在公司電腦上安裝 OpenClaw，導致把機器掛到了公網，被黑客入侵了整個公司內網。

也難怪 Karpathy 發(fā)出了本文開頭的感慨。本質上來說，Agent 缺少可控的「安全執(zhí)行邊界」、身份認證、權限管理，亟需一個可控的執(zhí)行環(huán)境和隔離機制。

而安全問題只是其中之一。我們知道，Agent 的任務往往具有一些非常典型的特點：生命周期短，并且?guī)в猩舷挛臓顟B(tài)。

很多 Agent 執(zhí)行任務的時間只有幾秒到幾分鐘，用完即銷毀，同時系統可能在瞬間創(chuàng)建大量執(zhí)行環(huán)境。然而傳統云計算架構主要是為長期運行的服務設計的，就會出現資源利用率低、冷啟動慢以及成本高的問題。

也就是說，Agent 的會話性、上下文敏感、極致彈性的資源架構，決定了需要更加靈活的服務資源支撐。

第三個挑戰(zhàn)來自并發(fā)規(guī)模。Agent 的并發(fā)規(guī)模遠遠超過普通應用。尤其是在強化學習訓練中，每一個智能體都需要一個獨立環(huán)境進行交互，需要海量的并發(fā)環(huán)境來實現。這對底層基礎設施提出了極高要求。

本質上，我們需要一個輕量級、快速啟動、可水平擴展的執(zhí)行環(huán)境來承載智能體所需的高并發(fā)任務。

實話說，目前的智能體及其執(zhí)行環(huán)境正處于一個野蠻生長的階段。據我們了解，行業(yè)內執(zhí)行環(huán)境 API 形態(tài)繁雜，至少存在十幾種不同的智能體協議。

缺少一個強有力的協議標準的情況下，智能體基礎設施在多云以及跨平臺的可移植性和規(guī)模化落地上形成了無形的巨大阻力。

護航企業(yè)「龍蝦類」智能體的基礎設施

這正是各大云服務和 AI Infra 廠商正在考慮的問題，讓 AI 擁有一個可控、可管理、高效執(zhí)行的空間，是智能體「自主執(zhí)行時代」的兵家必爭之地。

我們發(fā)現，騰訊不僅在養(yǎng)龍蝦這件事上上心，更要在 AI Infra 領域深度擁抱智能體時代。

騰訊云云原生產品副總經理、騰訊云專家工程師 Gary認為「AI agent 的這一次的變化，改變企業(yè)的形態(tài)、改變社會的形態(tài)、改變組織的形態(tài)、改變軟件的形態(tài)、改變用云的角色的形態(tài)。」

為此，騰訊云 Agent Runtime 深度洞察企業(yè)核心訴求，為企業(yè)級 AI 智能體應用打造了全方位的專業(yè)支持，助力企業(yè)高效構建智能化能力。

騰訊云 Agent Runtime 的解決方案包含瀏覽器、code 執(zhí)行、手機、電腦等豐富的沙箱類型，提供全鏈路安全、Agent 原生資源架構、極致彈性與生態(tài)兼容的能力，實現極速啟動和十萬級實例并發(fā)開箱即用的領先特性，讓 Agent 在企業(yè)應用中具備安全、可靠的執(zhí)行環(huán)境。

作為 AI Agent 走向產業(yè)化的核心驅動力，騰訊云 Agent Runtime 已成為支撐騰訊內部及多家國內頭部大模型企業(yè)的關鍵基礎設施。

目前，該平臺已穩(wěn)健托管數十萬個 Agent 實例，能夠完美補齊企業(yè)級場景所需的可用性、安全性與可治理性，打通了從開源框架到生產力工具的「最后一公里」。

開發(fā)者們選擇騰訊云 Agent Runtime 很重要的原因，是其開箱即用的省心特性。騰訊云 Agent Runtime 解決了以 OpenClaw 為代表的這類自主智能體，在企業(yè)級部署中最令人頭疼的兩大問題：

Agent 狀態(tài)管理

我們知道，Agent 和普通服務不一樣，會在運行過程中不斷留下狀態(tài)，并且大部分時候處于等待任務的狀態(tài)。

如果讓它常駐運行，高昂的成本讓企業(yè)難以承受；如果隨用隨啟，Agent 在運行過程中積累的上下文、工具鏈產物和環(huán)境配置就會隨著容器的銷毀而化為烏有。

Agent Runtime 的核心突破在于實現了狀態(tài)與算力的解耦。沒請求時暫停實例、釋放算力；有請求時自動恢復，整個文件系統原樣保留。這樣一來，Agent 空閑時可以停，干活時又能從上次的狀態(tài)接著干。

在這個基礎上，Agent Checkpoint也就成了自然能力。一個已經調教好的 Agent，可以在任意時刻做快照，后續(xù)用來恢復、回滾，或者直接克隆出更多實例，讓已經積累下來的經驗和能力可以復制、繼承。

Agent 行為治理

Agent 擁有編寫代碼和調用接口的能力，這賦予了它極高的生產力，但也帶來了巨大的行為管理難題。企業(yè)要讓它們運行在可控、可審計的邊界里。

Agent Runtime 會對所有 Agent 都進行嚴格的隔離。每個 Agent 實例都運行在獨立的 VM 級安全沙箱里。這樣即使某個實例被攻破或者出了異常問題，影響也只會停留在它自己身上，不會影響其他實例或平臺。

對外訪問及本地敏感操作統一治理。Agent 發(fā)起外部請求時，憑證不保存在實例里，而是由 Gateway 按需注入、用完即銷毀，做到實例本地零憑證；權限由網關統一控制、統一審計；刪除資源、修改權限、發(fā)起外部請求這類高危操作，還可以配置審批或攔截規(guī)則。

這套方案的本質，是 AI Infra 的能力基礎，承托起 Agent 業(yè)務的靈活高效。這一架構沒有試圖通過限制「龍蝦」的感知和行動來換取安全，反而為企業(yè)補齊了安全、治理與運營的基礎設施。

不懼變動的數據資產

Agent 在運行中沉淀三類資產：技能（Skill）、記憶（Memory）、協作關系

三類資產從第一天起就獨立于框架存儲和管理。Skill 以制品形式入庫，版本管理、權限管控，任意實例可引用；Memory 從本地同步上云，跨實例共享，新 Agent 繼承老 Agent 的經驗；Agent 之間通過 Gateway 做服務發(fā)現和路由，協作在平臺層編排，不依賴框架私有協議。

Agent 框架可能會更新、會被替代，但 Agent 們積累的數據不會過時。知識與技能永遠留在企業(yè)內部，不跟著個人走，也不跟著框架走，最終轉化為企業(yè)的生產資料。

迎接智能生產力

AI 進入企業(yè)，發(fā)生變化的不會只有技術。流程、分工、權限、成本，都會跟著進行進化。

Agent Runtime 的核心使命，是為企業(yè)提供一套全局視角的「AI 員工」管理模式，讓組織能夠接得住、管得好這股新型生產力。

Agent Runtime 服務于企業(yè)對全局 Agent 的技能、行為、權限和成本的管控：平臺團隊先把 skill、初始化腳本、鏡像和配置封裝成模板，統一化管理任意開源或自建 Agent 在內部的創(chuàng)建和版本變更；再通過策略管控所有 Agent 的工具調用、數據訪問、LLM 調用等行為執(zhí)行邊界；還可以通過 token 額度管理實例、用戶和組織三層的成本消耗。

在騰訊云 Agent Runtime 的加持下，龍蝦不再難以馴服，能夠成為在企業(yè)復雜網絡環(huán)境中縱橫馳騁、安全合規(guī)的高產工具，成為了企業(yè) AI 轉型的第一步

業(yè)界最強性能亮相，Minimax 用上也「真香」

隨著 AI 演進從簡單的「會話」跨越到「動態(tài)交互」，Agentic RL（智能體強化學習）已成為通往 AGI 的必經之路。

如果說大模型的「大腦」是通過海量文本喂養(yǎng)出來的，那么真正具備自主靈魂的智能體，則是通過在真實環(huán)境中的「摸爬滾打」練就的。

Agent RL 最大區(qū)別就是需要和環(huán)境交互，交互好壞影響訓練效率和效果。這種交互一般是在沙箱中執(zhí)行的，因此沙箱是強化學習的「命門」，是決定 Agent 進化速度與天花板的核心基礎設施

騰訊云 Agent Runtime 作為最前沿的智能體基礎設施技術突破，在今年的英偉達 GTC 大會上亮相。

在 GTC 大會上，騰訊云團隊提出，Agent RL 將帶給沙箱的挑戰(zhàn)推向了極致：需要訓練、推理、環(huán)境交互與系統復雜性的四重疊加

騰訊云 Agent Runtime 智能體沙箱在 GTC 的亮相，吸引了全球開發(fā)者的目光。沙箱已從單純的安全組件，進化為 Agent 時代的「基礎設施一等公民」。通過 Agent-Native 的設計理念，它正為全球開發(fā)者提供一個更安全、更高效、更具擴展性的 Agent 進化搖籃。

毫秒級啟動，十萬級并發(fā)，MiniMax 高性能穩(wěn)定落地

還記得過年前后，那個溫暖打工人錢包的 1 美元時薪大模型 MiniMax M2.5 嗎？

一個 10 B 參數量的全能選手，在多語言任務 Multi-SWE-Bench 上拿下了行業(yè)第一；在 SWE-Bench Verified 評測集上，基于 Droid 和 OpenCode 的實戰(zhàn)測試中，它的通過率（79.7% / 76.1%）雙雙超越 Opus 4.6。

而鮮為人知的是，MiniMax 與騰訊云在 Agent RL 場景下進行了合作，在騰訊云 Agent Runtime 的強大性能的基礎上，突破了現實世界的智能體 RL 的「不可能三角」：平衡系統吞吐量、訓練穩(wěn)定性和智能體靈活性。

MiniMax Forge 架構圖

交互環(huán)境的并發(fā)、彈性和質量直接決定了模型訓練的效率和效果。

極致性能響應：實現 80ms 極速啟動與 P99 延遲小于 1 秒，確保 Agent 在復雜任務中獲得近乎實時的交互反饋。
海量并發(fā)能力：支持每分鐘十萬級沙箱實例的并發(fā)創(chuàng)建與瞬時銷毀，實現 99.99% 的穩(wěn)健成功率。
分發(fā)加速架構：憑借「鏡像去重 + 多級緩存 + 加速中心」的三位一體技術，實現數十萬鏡像的分發(fā)加速。
全場景環(huán)境模擬：深度覆蓋代碼、瀏覽器、手機及桌面端全平臺環(huán)境，原生適配 SWE-bench 與 OSWorld 等主流 Agent 評測標準。
原生開發(fā)生態(tài)：提供兼容 E2B 協議的開源 SDK、API 及完整工具鏈，深度集成主流訓練框架以實現無縫遷移。

依托騰訊云提供的 Agent Runtime 沙箱服務，MiniMax 實現了強化學習場景中大規(guī)模交互環(huán)境的毫秒級拉起、十萬級并發(fā)、瞬時銷毀，大幅提升了并發(fā) Rollout 的訓練吞吐量和穩(wěn)定性，更為模型在系統終端的自主試錯構建了安全邊界。

在性能方面，騰訊云 Agent Runtime 在單個鏡像（如 Code Interpreter）場景下，大規(guī)模并發(fā)啟動沙箱，最大可以支持每分鐘 60 萬沙箱創(chuàng)建，QPS 可以達到 1 萬以上，整體P99 延遲控制在 1 秒左右。因為整體架構沒有單點依賴，整體系統仍然可以橫向擴展。

在 SWE RL 場景下 Agent Runtime 沙箱的壓測效果可以達到16 萬 QPM 的吞吐，P99 延遲控制在 1 秒以內，成功率達 99.99%。這仍然不是 Agent Runtime 沙箱的并發(fā)上限，系統支持便捷橫向擴容。

MiniMax 與騰訊云的深度技術共建，有效突破了傳統架構在大規(guī)模并發(fā)、極速啟動上的能力瓶頸。

MiniMax 的 Agent 首席架構師阿島說，目前 Agent 已經能夠自主地驅動很大部分的 agentic RL 過程，但「這里面最有可能卡住的就是沙箱的環(huán)節(jié)，（如果任意環(huán)節(jié)卡住）就會極大的影響我的模型的迭代，如果迭代速度慢了，那可能和別的模型相比，我的競爭力就會受到影響。」

在如此白熱化的激烈競爭態(tài)勢下，Minimax 與騰訊云 Agent Runtime 的協作，從輕量級調度、極致存儲優(yōu)化，到全場景的真實環(huán)境模擬，這套 Agent Infra 方案，為強化學習框架提供了一個極致彈性、可持續(xù)擴展的生產級試驗場，對 Minimax 保持強勢的競爭力至關重要。

結語：在狂野西部，建立文明的邊界

我們獲悉，騰訊云 Agent Runtime 底層平臺 Cube 將全面開源，企業(yè)可直接用于智能體訓練和部署。

如果說 OpenClaw 的爆火象征著 AI 開發(fā)者們在「狂野西部」的一次集體沖鋒，那么騰訊云 Agent Runtime 的出現，則標志著這場運動開始從無序走向秩序與成熟。

過去我們習慣于討論模型的參數量、推理能力或是多模態(tài)性能，但在「自主執(zhí)行時代」，這些只是智能體的「大腦」。正如 Karpathy 所擔憂的那樣，沒有安全邊界和性能保障的智能體，很可能是數字世界混亂的源頭。

騰訊云 Agent Runtime，第一次為這群「數字員工」提供了一個既能自由探索、又絕對可控的「數字化工位」。

基礎設施的演進往往滯后于應用層爆發(fā)，但它決定了應用能走多遠。當毫秒級的冷啟動、容器級的安全隔離以及標準化的執(zhí)行協議成為標配，智能體才真正具備了大規(guī)模進入產業(yè)生產線的資格。

騰訊云 Agent Runtime 正在成為智能體時代的「調度中心」，更是智能體自我學習，通往 AGI 閉環(huán)過程中，不可或缺的一塊拼圖。

這只從圈子里「跳出來」的龍蝦，終于在云端找到了它最穩(wěn)健的棲息地，也找到了它通往自我進化的快車道。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.