龍蝦,是最近 AI 圈出現頻率最高的詞匯。
它指的是 OpenClaw,一個近期在 AI 圈迅速蔓延的開源智能體框架。有人覺得它像賈維斯,有人覺得它像腳手架,有人覺得它像輕量級操作系統,所有人都在用,而且越用越停不下來。
圍繞它的討論也隨之而來:龍蝦能干什么,干不了什么,下一步往哪走,算力夠不夠,誰在受益,誰在焦慮。現在,行業里最靠近前線的一批人坐下來,認真聊了聊這件事。
![]()
就在剛剛,月之暗面創始人楊植麟在北京中關村論壇年會的開源主題圓桌中主持了一場五人談話,智譜創始人張鵬、無問芯穹創始人夏立雪、小米 MiMo 大模型負責人羅福莉、香港大學助理教授黃超共同參與。
對話從 OpenClaw 的實際使用體驗出發,延伸至模型定價邏輯、推理基礎設施的結構性瓶頸、模型架構創新,以及對未來十二個月行業走向的集體判斷。
從聊天到真正干活,OpenClaw 改變了什么
論壇開場,楊植麟拋出了一個共同話題:日常使用 OpenClaw 或類似產品,最有想象力的體驗是什么?從技術角度看,如何理解今天智能體框架的演進方向?
張鵬說,他很早就開始自己動手折騰這類工具,當時還不叫 OpenClaw,最早叫 ClawBot。畢竟是程序員出身,折騰這些東西有自己的手感。
在他看來,OpenClaw 最大的突破在于把頂尖模型的能力,尤其是編程和智能體方面的能力,交給了普通人。
「這件事不再是程序員或極客的專利。它在模型上方搭起了一個牢固又靈活的腳手架,讓原來因為不會寫代碼而無法實現的想法,今天通過簡單的對話就能完成。」
![]()
智譜創始人張鵬
他更愿意把 OpenClaw 這類工具稱為腳手架,它提供的是一種可能性,而不是一個封閉的產品。
夏立雪的第一反應是不適應。他習慣了和大模型聊天的交流方式,一開始發現 OpenClaw 響應慢,覺得很卡。但后來他意識到,這類工具和聊天機器人有本質區別:它更像是一個能承接大型任務的人,而不是一個回答問題的工具。
「從按 token 計費的模型,到能幫你完成任務的智能體,AI 的想象力空間已經做了一次大的躍升。但與此同時,對整個系統能力的要求也大幅提升,這就是我一開始覺得它卡的原因。」
他隨后披露了一個直觀的數據:無問芯穹從今年一月底開始,基本上每兩周 token 用量翻一番,到目前為止已經翻了十倍。「上次見到這個增速,還是 3G 時代手機流量剛普及的感覺。那時候大家每個月一百兆流量,現在的 token 用量就是那種感覺。」
他認為,現有的所有資源想要支撐這個快速增長的時代遠遠不夠,需要更好的優化和整合。
羅福莉從產品框架設計角度給出了不同的觀察。
她把 OpenClaw 視為 agent 框架領域一次革命性和顛覆性的事件。她注意到,深度 coding 圈子里很多人的第一選擇依然是 Claude Code,但她認為只有真正用過 OpenClaw 的人才能感受到這個框架在設計層面的獨特之處,包括近期 Claude Code 的很多新更新,其實也在向 OpenClaw 的設計方向靠近。
![]()
小米 MiMo大模型負責人羅福莉
她總結了 OpenClaw 核心價值的兩個層次。
第一是開源。開源讓整個社區能深度參與、持續改進,這是一個非常重要的前置條件。她認為,開源框架的一個關鍵價值在于把國內參數量不那么大、但水平仍然可觀的模型的能力上限大幅拉高。
「在絕大部分場景下,任務完成度已經非常接近 Claude 最新模型的水平,同時它靠一套完整的 harness 系統和 skills 體系把下限也保證得很好。」
第二是點燃了大家對大模型之上那一層的想象力,也就是智能體層。她看到越來越多非研究員背景的人開始通過更強的 agent 框架參與 AGI 的變革,一定程度上替代自己工作中的重復任務,把時間釋放出來做更有創造力的事情。
她還提到了一個具體的使用感受:相比 Claude Code 只能在桌面上延展創意,OpenClaw 可以隨時隨地參與進創意過程,想象力的擴展沒有場景限制。
黃超從交互模式切入,分析了 OpenClaw 能引發廣泛關注的原因。
他認為第一個關鍵因素是「活人感」。
以往的 Cursor、Claude Code 這些 agent 工具,使用起來更像工具;OpenClaw 以 IM 軟件嵌入的交互方式呈現,讓人感覺更接近自己想象中的個人賈維斯。「這種活人感是很多人第一次真正覺得 AI 要來了的時刻。」
第二個因素是,OpenClaw 再次驗證了 agent loop 這種看似簡單但極為高效的框架范式。第三個值得思考的問題是,我們到底需要一個 all-in-one 的超級智能體,還是一套類似輕量級操作系統或腳手架的存在,去撬動整個生態里所有的工具和能力。
他傾向于后者,認為 OpenClaw 更像一個操作系統級別的小管家,通過這個入口,社區里越來越多的人開始設計面向這類系統的應用,以 skills 和 harness 的形式去賦能各行各業,這和整個開源生態天然結合得非常緊密。
干一個任務,消耗原來百倍的 token
楊植麟隨后把問題引向了智譜最新發布的 GLM-5-Turbo 模型,以及伴隨而來的提價策略,并問這背后反映了什么樣的市場信號。
張鵬說,這次更新是在整個發展目標中提前放出來的一個階段性成果。核心目標只有一個:從「對話」轉向「干活」。
OpenClaw 讓大家意識到大模型真的能幫人完成任務,但這背后對模型能力的要求遠超以往。
「它需要自己做長時間的任務規劃,不斷壓縮上下文,隨時 debug,還要處理多模態信息。這和傳統面向對話的通用模型完全不同。」
GLM-5-Turbo 在這些方面做了專門的加強,尤其是在如何讓模型持續自我 loop、不停執行任務這個問題上投入了大量工作。
![]()
同時也做了效率優化,在面臨復雜任務時能用更高效的推理路徑完成,避免用戶只看到賬單上的數字在不停往下掉。
對于提價,在他看來,現在完成一個復雜任務,模型背后的推理鏈路很長,要寫代碼、要和底層基礎設施打交道、要隨時修正錯誤。
消耗的 token 量可能是回答一個簡單問題的十倍甚至百倍。模型變大了,推理成本相應提高,價格自然要回歸正常的商業價值。
「長期靠低價競爭,對整個行業的發展都不利。我們需要一個良性的商業閉環,才能持續優化模型能力,持續給大家提供更好的服務。」
現有的云計算架構,并非為 AI 設計
隨著 token 用量的爆發和行業從訓練時代轉向推理時代,推理基礎設施的壓力成為不可回避的話題。
夏立雪說,無問芯穹是一家誕生在 AI 時代的基礎設施廠商,目前同時為 Kimi、智譜以及多所高校科研機構提供服務,也在和 MiMo 合作。他們一直在思考一個核心問題:AGI 時代需要的基礎設施是什么樣的,以及如何一步步去實現和推演它。
在他看來,當前腳下最緊迫的問題是如何打造一個更高效的 token 工廠。
無問芯穹的做法是從軟硬件打通的角度出發,接入了國內幾乎所有種類的計算芯片,將幾十種芯片和幾十個不同的算力集群統一連接起來。
![]()
無問芯穹創始人夏立雪
「資源不足時,最好的辦法有兩個:第一,把能用的資源都用起來;第二,讓每一分算力都用在刀刃上,發揮出最大的轉化效率。」
他們也在探索最新的模型結構和硬件結構之間能否產生更深的化學反應。但他認為,僅僅打造一個標準化的 token 工廠還不夠。
他提出了一個更根本的判斷:當前大量云計算基礎設施,在設計上服務的是人類工程師,而不是 AI。「我們做了一個基礎設施,上面的接口是為人做的,再往上包一層才能接入智能體。這種方式用人的操作能力限制了智能體的發揮空間。」
他舉了一個具體的例子:智能體能做到秒級甚至毫秒級地思考和發起任務,但現有的很多底層能力根本沒有為這個速度做好準備,因為人類發起一個任務通常是分鐘級別的。這個問題需要打造一套更智慧化的調控系統,他們把它稱為 agency 能力的一部分。
從更長遠的視角看,他認為真正 AGI 時代到來時,連基礎設施本身也應該成為一個智能體,能夠自我進化、自我迭代,形成自主的組織。
「相當于基礎設施有一個 CEO,這個 CEO 是一個 agent,它根據 AI 客戶的需求自己提需求、迭代自己的基礎設施。這樣 AI 和基礎設施之間才能產生真正的耦合,而不是一個接收需求、另一個執行的單向關系。」
他們目前也在探索讓 agent 和 agent 之間更好地通信,以及 cache to cache 的復制能力。在他看來,基礎設施和 AI 的發展應該產生非常豐富的化學反應,這才是真正意義上的軟硬協同,也是無問芯穹一直想實現的使命。
算力限制,反而催生意外突破
羅福莉沒有直接回答小米的獨特優勢,而是把問題拉到了整個中國大模型團隊的層面,認為這個視角更有價值。
她說,大約兩年前,她就看到中國基座大模型團隊開始了一次非常重要的突破。這個突破來自于一個被逼出來的命題:在有限算力、尤其是 NVLink 互聯帶寬受限的情況下,如何突破低端算力的限制,在看似為了效率妥協的情況下做模型結構上的創新。
DeepSeek V2、V3 系列,以及后來的 MiniMax M1 等,都是這類探索的產物。
「這些創新引發了一次真正的變革:怎么在算力一定的情況下,把智能水平發揮到最高。DeepSeek 給所有國內大模型團隊帶來了一個勇氣和信心。」
![]()
她強調,雖然今天國產芯片的限制已經沒有那么嚴峻,但這段時間被逼出來的對更高訓練效率、更低推理成本的模型結構探索,形成了真正有價值的技術積累。
她提到了幾個具體方向:混合稀疏架構(hybrid sparse)、Kimi 的 KSA 架構、小米面向下一代的新結構。這些都區別于當前這一代的 transformer 架構,是在思考如何為智能體時代做更好的模型結構創新。
她特別強調了長上下文能力的重要性,并把它和 OpenClaw 直接掛鉤。
「OpenClaw 越用越好用、越用越聰明,前提是你的推理上下文足夠長。但很多模型做不到一兆甚至十兆的 context,不是能力問題,是成本問題,推起來太貴、速度也太慢。只有在長上下文下成本夠低、速度夠快,才能把真正有生產力價值的復雜任務交給模型去完成。」
她進一步描述了這條路徑的終點:在超長 context 的支撐下,模型可以在復雜的環境里完成對自我的進化,包括對框架本身的優化,也包括對模型參數本身的迭代。
這個方向在預訓練側要做好長上下文架構,在后訓練側要構造更有效的學習算法,采集在一兆、十兆、百兆上下文里真實具有長期依賴性的文本和復雜環境軌跡數據。
她也分享了一個來自團隊內部的數據:借助 Claude Code 加頂尖模型的組合,團隊做大模型研究的同學,研究效率已經提升了近十倍。
規劃、記憶與工具調用
黃超從技術角度系統梳理了當前智能體框架在三個核心模塊上的主要痛點和未來方向。
規劃層面,他認為面向復雜任務、超長上下文的規劃能力仍然不足。比如五百步甚至更長的部署任務,很多模型做不好規劃,本質上是缺乏垂直領域的隱性知識。
他認為一個方向是把復雜任務的領域知識固化到模型里。skills 和 harness 這類工具,一定程度上也是在通過提供高質量的外部能力來緩解規劃中出現的錯誤。
記憶層面,信息壓縮和檢索精度始終是難題。任務復雜度上升時,context 會暴增,目前各類智能體框架普遍采用的還是文件系統這種最簡單的共享方式。
他認為未來的 memory 機制需要走向分層設計,但通用化很難實現,因為 coding 場景、deep research 場景、多媒體場景的數據模態差異極大,如何對這些 memory 進行高效檢索和索引,始終是一個 trade-off(權衡)問題。
![]()
他還指出了一個新的壓力來源:未來可能不止一個智能體,每個人可能同時擁有一群智能體,Kimi 的 agent swarm 機制已經指向了這個方向。
一群智能體帶來的上下文暴增,會遠超單個智能體,對 memory 機制和整個 agent 架構都是非常大的壓力,目前還沒有一套成熟的機制來應對這個問題。
工具調用層面,他認為高質量的 skill 依然稀缺,這和當年 MCP 時代高質量工具稀缺的問題如出一轍。
低質量的 skill 會直接拉低任務完成率,惡意注入的安全風險也是一個不容忽視的問題。他認為這需要整個社區共同建設,甚至需要探索如何在執行過程中動態進化出新的 skill,而不是依賴人工預設。
未來十二個月:生態、自迭代、可持續與算力
論壇最后,楊植麟請每位嘉賓用一個關鍵詞描述未來十二個月最重要的趨勢。
![]()
月之暗面創始人楊植麟
黃超感慨,十二個月在 AI 領域已經是很遙遠的事情,不知道屆時會發展成什么樣子。他給出的關鍵詞是「生態」。
他認為現在大家使用智能體還帶著新鮮感,但未來真正的挑戰是讓它沉淀成日常工具,從個人助手轉變為真正的打工人和 coworker。這需要模型迭代、skills 平臺建設、各類工具的共同推進,大家一起把整個生態向智能體原生的方向拉。
他還提出了一個有趣的判斷:未來大量軟件可能不再面向人類,而是面向智能體原生設計的。人類需要 GUI,但 Agent(智能體)不需要,整個生態正在從 GUI 和 MCP 的模式轉向 CLI 模式。這意味著軟件系統、數據乃至各種技術,都需要完成一次向 agent native 的轉型。
羅福莉給出的詞是「自進化」。
她說這個概念聽起來有點玄,但她最近對它有了更具體的體感和更務實的實操方案。關鍵在于:借助足夠強大的模型,當你在智能體框架里疊加一個可驗證的約束條件,再設定一個持續的 loop,讓模型不停迭代優化這個目標,你會發現它能持續拿出更好的方案,而且能自主運行兩三天。
她舉了一個具體案例:在探索更好的模型結構這類有明確評估標準的科研任務上,模型已經能夠自主運化和執行兩三天。
「自迭代是唯一能創造出這個世界上不存在的新東西的路徑,它不是替代人的生產力,而是像頂尖科學家一樣去探索未知。我一年前覺得這需要三到五年,但現在我認為一到兩年內就可能真正實現。」
![]()
她預計,結合強大的自迭代 agent 框架,對科研的加速將達到指數級。
夏立雪選擇了「可持續 Token」。他說,現在整個發展還在一個持續的過程中,需要讓它有長久的生命力。
他用了「AI made in China」來描述他的愿景:把中國在能源和算力上的優勢,通過高效的 token 工廠持續轉化為優質的 AI 能力,輸出到全球。
「從 made in China 到 AI made in China,邏輯是一樣的。中國能把低成本的制造能力變成好商品輸出全球,同樣可以把這種能力遷移到 token 的生產和輸出上。」他希望在今年看到這件事真正成形,讓中國成為世界的 token 工廠。
張鵬的關鍵詞則是「算力」。
在他看來,「所有技術的前提,是大家用得起。你不能因為算力不夠,提一個問題讓它思考半天也不給答案,這肯定不行。」
他提到了一句在行業里流傳的話:沒卡沒感情,談卡傷感情。需求已經是十倍百倍地爆發,而很大一部分需求還沒有被滿足。
「算力問題是接下來十二個月最需要大家一起想辦法的事情。」龍蝦打開了想象力的上限,但算力、架構和基礎設施,還在進步的路上。
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.