網易首頁 > 網易號 > 正文申請入駐

從Manus到Claude Code：Agent正在經歷一場"六階段"范式轉移 | GAIR Live 027

2026-04-19 11:02:29　來源: AI科技評論

廣東舉報

分享至

Agent 時代真正的變革，才剛剛開始。

作者丨岑峰

過去一年，日新月異的Agent 賽道完成了一輪螺旋式上升的范式循環：

2025 年 3 月，Manus 以三級結構落地，首次將 “數字化員工” 產品化，完成了全行業的用戶啟蒙；

隨后 OpenClaw 憑借本地化部署、數據主權與輕量化體驗迅速爆火，驗證了市場對 AI 操控電腦（Computer Use）的真實付費意愿；

近期，Anthropic 攜原生系統級能力的 Claude Code 強勢入場，以底層架構優勢沖擊工業級市場。

三款現象級產品接連引爆，標志著 Computer Use 已成為大廠與創業者的核心戰場，Agent 發展正式從 “單體能力比拼” 進入 “系統工程與生態卡位” 的深水區。

"這說明了Agent的演進不是線性的，而是螺旋式上升的。"在GAIR Live第27期的圓桌討論中，OpenManus核心貢獻者張佳釔這樣評價。就在Claude Code發布的同一時期，Manus、OpenClaw、Codex等Agent產品密集涌現，整個行業仿佛在一夜之間進入了"深水區"。

這場由OpenManus 主要貢獻者張佳釔、Nanponova AI 創始人兼 CEO 常楠兩位實戰派嘉賓共同參與的對話，試圖回答一個核心問題：當Agent從Demo走向生產環境，從技術嘗鮮走向工業級應用，創業者的真正壁壘究竟何在？

答案或許藏在張佳釔提出的"六階段"理論中，也可能藏在常楠所說的"臟活累活"里。但有一點是確定的：Agent 競爭已從模型智力的單點突破，轉向工程能力、場景落地、數據主權、生態構建的全方位較量，螺旋上升的背后，是能力、產品、商業、生態四重邏輯的同步重構。

Manus、OpenClaw、Claude Code 的定位與躍遷

Agent 產業的爆發并非無序狂奔，而是遵循清晰的階段化規律。張佳釔基于其提出的Agent 發展六階段論，為當前三款現象級產品劃定了精準的技術坐標，也厘清了行業螺旋進擊的內在邏輯。

反直覺的是，不同于部分自媒體“Claude Code全面‘龍蝦化’”的總結，他提出技術演進順序應為 Claude Code/CodeX 在前，OpenClaw 在后 —— 正是 Claude Code 等工具驗證了 Coding 與系統操控的極強可用性，才催生 OpenClaw 將能力從開發者群體延伸至普通非開發者用戶，完成了大眾化市場的滲透。

Computer Use 成為核心戰場

OpenClaw 的爆火，本質是市場對本地操作、數據主權、隱私可控需求的集中釋放，也讓 Computer Use 正式成為 Agent 競爭的核心賽道。而這一賽道的崛起，既是模型能力突破的必然，也是舊 API 自動化范式走到盡頭的結果。

常楠直言，Computer Use 解決的是人機交互的 “歷史遺留問題”：過去所有軟件都為人類設計，GUI 統治生態；而 Agent 時代，交互正在向計算機原生的 CLI 形態回歸。未來應用會擁有兩套接口，即保留 GUI 供人類使用，同時搭建 AI 專屬原生接口。而當前 Computer Use 的爆發，核心驅動力是多模態大模型（VLM）的技術成熟，視覺能力與系統操作能力結合，讓模型代勞的工作范圍呈幾何級擴張。

當前 Computer Use 形成兩條核心技術路線：基于視覺 VLM 模擬點擊（OpenClaw 路線）、通過原生指令集系統接管（Claude Code 路線）。海外平臺接口開放，原生指令集效率更高；國內內容生態高度封閉，視覺方案成為跨越 “圍墻花園” 的主要渠道。張佳釔補充，Computer Use 的核心是為 Agent 獲取更多上下文與權限，CLI 方案在專業場景效率更高，而視覺 VLM 是更通用的能力，能覆蓋海量未知長尾場景。長路徑決策的幻覺積累是最大技術難點，巨頭在強化學習數據上占據優勢，而 Claude Code 走出的 “視覺 + 系統指令” 混合模式，成為全行業可借鑒的方向。

Coding 是 Agent 的 “第一性原理”：

自主造工具才是真智能

在本輪范式演進中，Coding 的核心地位被反復強調，兩位嘉賓一致認為：Coding 是 Agent 擴展能力邊界的第一基石，是 Agent 的第一性原理。

常楠高度認可 Anthropic 的路徑：編程不只是寫代碼，而是系統級問題解決。當 Agent 能在現有工具不足時自主編程創造新工具，才真正具備工業級價值，這也是區分 “單純效率工具” 與 “真正智能體” 的分水嶺。相比簡單的屏幕識別和模擬點擊，能夠理解系統底層邏輯并生成執行代碼的 Agent，才能支撐復雜任務、長程執行與跨場景協作。

2025 年初 Claude Code 初版受限于基座能力，隨著模型迭代，Agent 架構從 Manus 式的 “手工流” 快速升級為深度 “智能體流”。未來理想場景是Agent 網絡：向網絡發布任務，現有 Agent 無法完成時，自動協作并自主編寫新工具解決問題，這正是 Coding 作為第一性原理的終極體現。

效率工具創業者面臨 “降維打擊”，

垂直場景迎來紅利

范式的快速演變，對一線創業者帶來了生存空間的劇烈波動，行業呈現兩極分化。

常楠判斷：基模公司必然從售賣 Token 延伸至產品側與效率側，純效率工具類創業者將面臨降維打擊；而垂直場景應用開發者則迎來重大利好。他的團隊圍繞 Claude Code 構建 Skill Set 與 Harness，實現從需求分析、PRD 生成、TDD 到代碼編寫的全鏈路自動化，原本一兩個月的交付周期壓縮至一周，效能提升呈指數級。

同時，企業需求的分化進一步加劇行業格局：大型企業極度看重過程可審計、數據私有化，傾向私有化部署；中小企業與個人用戶更看重便利性，愿意適度讓渡隱私。中國與海外的生態差異，也讓 OpenClaw 這類輕量化、本地化產品在國內獲得遠超硅谷的熱度。

Agent 的下一輪爆發點：

從模型智力到系統工程

圓桌的最后，兩位嘉賓共同指向一個核心結論：Agent 競爭已徹底從 “模型智力” 轉向 “系統工程能力”，VLM 與 CLI 路線、開源與閉源、通用與垂直，最終都要回歸 “為用戶創造真實價值” 的本質。

張佳釔預判了 Agent 的兩大未來方向：一是個性化學習，Agent 從交互中學習個人偏好，行業急需建立個人偏好與智能體行為關聯的數據標準；二是智能體網絡（Agent Network），企業內智能體獲得全員權限，處理文檔、會議、協作，推動組織向 AI Native 轉型；社會層面，個人知識技能通過 Agent 資產化、可交易，智能體間實現自動任務定價，這一方向將在近幾個月迎來重大機會。

而整個產業的螺旋進擊，最終會走向一個清晰的終局：模型廠商聚焦底層能力與生態構建，開源社區負責輕量化創新與用戶體驗補全，創業者深耕垂直場景與行業 Know-how，三方形成互補共生的生態。Manus 完成啟蒙，OpenClaw 驗證需求，Claude Code 定義工業級標準，三者共同推開了 Agent 時代的大門，而真正的產業變革，才剛剛開始。

以下是本次圓桌的實錄，AI 科技評論進行了不改原意的編輯：

岑峰（主持人）：歡迎來到雷峰網AI科技評論主辦的GAIR Live線上圓桌。最近一年，Agent 領域正經歷一場螺旋式上升：

2025 年 3 月，Manus 以三級結構亮相，將“數字化員工”概念首次產品化并完成了用戶啟蒙；隨后，OpenClaw 憑借本地化與數據主權優勢爆火，驗證了用戶對 AI 操控電腦（Computer Use）的付費意愿。近期，Anthropic 攜帶具備原生接管能力的 Claude Code 殺入戰場，試圖利用系統級優勢進行工業級收割。

這三款現象級產品的崛起，標志著“Computer Use”已成為大廠與創業者競爭的核心戰場。今天我們請到了這一領域的兩位頂尖實戰者：OpenManus的主要貢獻者張佳釔，以及Agent領域的資深創業者、Nanponova AI的創始人CEO常楠和我們一起討論。

佳釔曾提出過 Agent 發展的“六階段論”，在這個理論框架下，我們如何看待當前的范式演進？三款現象級產品，分別處于你那六個階段當中的怎樣的位置？

張佳釔：我先回顧一下我們之前說的六個階段。當時我們想的是，第一個階段是說純粹的對語言模型去做調用；第二個階段是要去做Agent for Flow；第三個階段是能夠跨環境的Financial Agent；第四個階段是Agent for Coding；第五個階段是真正每一個人擁有自己的Agent；第六個階段是Agent Network，能夠去跟其他人去做定價和交流。

Manus 處于“預定義環境自主 Agent”階段，其目標、環境權限均由人類預設。反直覺的是，我認為演進順序應該是 Claude Code 與 CodeX 在前，OpenClaw 在后。正是因為 Claude Code 等工具展現了極強的可用性，才催生了 OpenClaw 進一步將該能力從開發者群體引向非開發者領域。

我是CodeX的重度用戶，從個人體感來看，其能力經歷了兩次顯著的躍遷：

1.2025 年 9 月：當時的工具已能完成約 80% 的科研代碼工作，能夠支持三至四小時的長程執行。

2.2025 年 12 月：長程執行能力進一步增強，且代碼產出質量較上一版本有質的飛躍。

再到下一個階段，可能是Codex 5.4，或者說是Opus他們最近出的Computer Use功能。在這樣的情況之下，我們會注意到Agent已經實現了一個非常Native的通過Bash的工具，能夠去同時地對文本、對Code、對GUI環境去做處理，也能夠通過OS指令直接操控屏幕，也會有一些多模態的UI點擊操作。這個時候意味著模型本身已經進入了一個能夠同時很好地去做不同環境任務處理的空間。

岑峰：佳釔劃定了技術坐標，但坐標變遷對一線創業者意味著生存空間的波動。常楠老師，Manus 火熱時，大家在爭論“Agent APP”是否為終極形態。但現在看，后面又出現了OpenClaw和Claude Code這樣的形態。這一年來的范式演變對追求落地的創業者產生了哪些影響？

常楠：我跟佳釔感受還是蠻近的。我從 2024 年底開始使用 Cursor，見證了 AI 編程從自動補全到 Agent 化的過程。2025 年初 Claude Code 第一個版本受限于基模能力，但隨著模型增強，Agent 架構從早期的“手工流”（如 Manus）演進為深度的“智能體流”。

我非常認可 Anthropic 的路徑。編程不僅是寫代碼，更是系統級問題。它解決了 Agent 在發現現有工具不足時，如何通過自主編程創造新工具來完成任務。因此，Coding 是 Agent 擴展能力邊界的第一基石。

在 2025 年 9 月至 10 月期間，我開始將 Claude Code 與現有工作流結合。

對于非效率工具類的創業者，這種系統級能力的提升是巨大的賦能。我們圍繞 Claude Code 構建了一套 Skill Set 和 Harness：

?全鏈路自動化：從需求分析、設計文檔、PRD 生成到 TDD（測試驅動開發）及代碼編寫。

?效能提升：模型直接調用 CLI 工具進行自動化測試與回歸測試。原本需要一兩個月交付的成果，現在一周即可完成。

我的判斷是：基模公司必然從售賣 Token 延伸至產品側與效率側，這會讓純效率工具類的創業者感到焦慮，但對像我這樣做垂直場景的應用開發者則是極大利好。

岑峰：OpenClaw 的爆火證明了用戶對本地操作及隱私主權的看重。在商業落地中，客戶更在意Agent能“獨立完成任務”，還是在“視線范圍內受控干預”？

常楠：這取決于具體的應用場景。大型企業對“過程可審計性”極度看重。商業場景對確定性要求極高，企業不希望系統是黑盒，必須確保過程可追溯。此外，數據和工作流是企業的核心私有資產，大公司不愿將其暴露給外部模型廠商，因此更傾向于私有化部署。

相比之下，部分中小企業或個人用戶更愿意為了便利性犧牲一定隱私。因為在他們的某些領域里面，他們沒有非常私有的工作流，或者不太了解這些Knowhow，他們可能沒有那么關注這件事。

值得注意的是，中國用戶在移動互聯網時代已習慣于用隱私交換便利，而海外用戶則更為敏感。這種生態差異也解釋了為何OpenClaw在中國引發的熱潮比在硅谷更強烈。

我認為Coding能力的提升是延展模型能力的基礎。Anthropic當時的設想或許是：當Agent發現任務無法完成時，能夠自主編寫工具來解決問題。未來可能形成一個Agent網絡，不同Agent之間通過自主協作完成工具開發與任務分發。這與單純的OpenClaw模式在底層邏輯上仍存在差異。

岑峰：你剛才提到，你很確定Anthropic的路徑是正確的。可以稍微展開嗎？

常楠：2025 年初與 Anthropic 交流時，我意識到他們的邏輯非常前瞻：Coding 是一切能力的延展。未來的理想場景是一個“Agent 網絡”：當你向網絡發布一個 Job 或 Task，如果現有的 Agent 無法直接完成，它們會自動協作并“自主編寫”出一個新工具來解決問題。

這種“自主創造工具”的能力，是區分單純“效率工具”與真正“智能體”的分水嶺。這也是為什么 Coding Agent 在這一輪競爭中占據了絕對的制高點。相比簡單的屏幕識別和模擬點擊，能夠理解系統底層邏輯并生成執行代碼的 Agent，才具備真正的工業級價值。

岑峰：效率和主權永遠是客戶在不同場景當中需要權衡的一個因素。說到這個，開源社區會是一個有力的補充。回想當初Manus之后，社區迅速地出現了OpenManus。佳釔，當時你也提到OpenManus更像是一個中間性的意外產物。今天面對Claude Code這樣一個具備OS級原生權限的正規軍，開源社區的競爭策略又會是怎么樣的？

張佳釔：OpenManus當時確實是一個比較粗暴的中間東西。關鍵是在現在這樣的情況之下，開源這邊要怎么樣來跟Claude Code去互補。OpenClaw本身就已經給了一個很好的例子，就是通過非常快速迭代去增加，能夠讓用戶更多實際使用上體感更多的功能。OpenClaw做好的一點就是它可能通過非常多能夠讓你在真實生活中很方便地去做一些事情，通過這個東西來搶占用戶的心智，相比Claude Code可能有一個更迅猛的流量入口。

開源項目也是要考慮一樣的事情。如果只做開源，很難能夠預測模型能力本身的發展方向，可能更多能做的事情還是要從大家實際去使用的體驗去入手。

比如說最近我覺得有個非常好的開源項目叫OpenCLI，它會去把小紅書、推特，包括還有一些其他的軟件變成一個自動CRA工具，大家直接開箱就能用。雖然它本身不涉及非常多非常炫的概念，但是因為它本身是解決用戶的一個問題，所以本身也是得到了非常多的關注跟聲量。

如果到后面要做什么，可能還是要去做讓用戶本身更好用的功能。雖然這個東西可能也會很快被吃掉，但是帶來的信任，它可能是不太會被砍掉的。

岑峰:佳釔的意思也就是來更好地貼近用戶的需求，來和正規軍來做互補，打一個時間差。我們現在聊具體的技術，常楠，從你的觀察看，為什么這一年的Agent競爭中Computer Use會處于如此核心的地位？究竟是因為模型的能力到了一定的新高度，還是說舊的API自動化范式已經到了盡頭？

常楠：Computer Use 的崛起本質上是在解決一個“歷史遺留問題”。過去所有的軟件和應用都是為人類設計的，GUI（圖形用戶界面）統治了人機交互生態。現在，為 Agent 準備的工具正在回歸計算機創建之初的 CLI（命令行界面）形態。

我很早有過預判，未來的應用將擁有兩套接口：一套是保留 GUI ，供人和機器同時使用，另一套則是專門給 AI 調用的原生接口。當前 Computer Use 能力的提升，主要得益于多模態大模型（VLM）技術的發展。大廠在探索原生多模態模型時，將其視覺能力與操作能力的結合是極其自然的演化。當模型能夠通過視覺操作人類遺留的應用時，它能代勞的工作范圍將呈幾何倍數增長。

岑峰:常楠提到未來人和AI會有一個一個磨合的過程，目前 Computer Use 存在兩條主要路徑：一類是基于視覺 VLM 模擬點擊（如 OpenClaw），另一類是通過原生指令集接管系統（如 Claude Code）。這兩條路徑分別適用于哪些行業場景？

常楠：這取決于要解決的具體問題。在海外，平臺接口相對開放，付費即可獲取大量數據接口。但在國內，如小紅書等內容生態通常是封閉的，公司將數據視為核心資產，不愿提供公開的 API 或 CLI 接口。在這些封閉場景下，視覺方案就變得極具意義，因為這是跨越“圍墻花園”獲取數據、完成工作的唯一渠道。

岑峰:佳釔經常和開發者打交道，遇到的這樣的場景的問題應該也會更多。你還有什么補充嗎？

張佳釔：我認為 Computer Use 的核心在于幫助 Agent 獲得更多的“上下文”與“權限”。無論是走 OS 腳本路徑還是純 UI 點擊路徑，本質都是為信息獲取服務。

在我們自己實際Computer Use工具的內部開發中，大家更關注通過 Computer Use 實現社媒操作或自動化審批流程。如果你有更好的CLI，在特定專家場景下效率更高，但視覺方案的Computer Use是一種更通用的能力，它不依賴于具體的接口開發，能覆蓋大量未知的長尾場景。

岑峰:Computer Use 的技術難點在于長路徑決策中的幻覺積累，第一步點錯，后面步步皆錯。現在巨頭在強化學習數據規模上占盡優勢，是否會讓開源社區處于一個追趕的狀態？

張佳釔：我覺得可能不能說是開源社區，可能整個非“御三家”（DeepSeek、Qwen、Kimi）之外的公司，大家都要去解這個事情。首先這個地方其實是關于一個數據規模的問題。Computer Use的任務一般分為兩類，第一類是怎么樣去做導航（Navigation），即長程規劃；第二類是怎么樣來做對齊（Grounding），怎么樣來對一個準確的元素點擊頁面元素。

2025年整個學術界和工業界，基本上都是圍繞如何獲取更多的視覺數據展開。如字節的UI Task項目，他們標注了非常多的Computer Use數據。我們則是Code Agency來從頭到尾地構建一個Web AP，利用應用的狀態機提取它完整的軌跡，來得到更多的數據。數據規模確實是一個很大的問題，大家都是在去嘗試做這種數據的補充。

Claude Code（基于 CodeX 5.4）是一個重要的分水嶺。巨頭開始有意識地在純 UI 操作中揉入增強版 Bash 操作。這種“視覺+系統指令”的混合模式改變了數據分布。雖然我們處于追趕位，但這種通過系統底層能力提升效率的路徑，是開源社區可以借鑒并實現的。

岑峰:OpenClaw 火爆，很大程度上是因為它提供了本地部署和深度權限。如果未來開源項目也走向云端托管，相比 Claude Code 這種原生集成產品，優勢還剩什么？

張佳釔：OpenClaw 的價值在于它“侵入”了更多的本地權限，從而獲得了極其豐富的個人上下文，這讓它比云端 Agent 更“好用”。

云端托管對然方便，但差別在于，如果缺乏完整的權限支持，它的個性化做的沒有那么好，可能更多還是一個更General的Agent助手。這種情況下我覺得它不一定會比Manus那種產品體驗會做得更好。雖然本身我們也可以去做這種線上的調教，但沒有本地權限的話，可能有些事情沒有那么方便。

主持人：最近發生了 Claude Code 源代碼泄露的重磅事件。從技術角度看，這是否可以看作是給開源社區的一份“大禮包”？

張佳釔：Claude Code 代碼對開源社區來說肯定是有借鑒意義的。Claude Code 的工程實現非常出色，代碼比 OpenClaw 簡潔許多。它在上下文壓縮、腳手架（Scaffold）設計上的思路對開源項目有很強的借鑒意義，能幫大家快速補齊一些 Feature。

但從學術和核心競爭力的角度來看，腳手架本身并不是最終的決勝點，也不是閉源大廠真正的護城河。大家公認的閉源壁壘，依然在于其背后龐大的強化學習數據和訓練閉環。這份代碼雖然有參考價值，但并沒有想象中那樣能產生顛覆性的影響。

岑峰：佳釔提到 Claude Code 泄露的代碼中包含了大量工程套路和策略指令，這是否驗證了你此前關于“工程系統能力在 Agent 演進中至關重要”的判斷？未來 Agent 的演化方向會是什么？

張佳釔：我自己想做的一個點，是Agent應該能夠去從你跟它的交互之中去個性化學習。目前行業缺乏成體系的個人偏好與智能體行為關聯的數據標準（Bench）。如果 Agent 能夠從與個人的交互中持續學習并優化行為，將帶來質的改進。

其次，“智能體網絡”有望在近幾個月內迎來重大機會。在企業內部，如果你使用如飛書、Slack 等協作工具，里面會有很多文檔信息、對話信息、會議、與同事的協作等數據內容，智能體若能獲得與真人同等的權限，去處理文檔、對話及日常會議，就能構建出一套員工間的智能體協作網絡。這本質上是企業向“AI Native 組織”的轉型。

從社會角度看，每個人的獨特知識和技能未來可以通過 Agent 進行“資產化”并對外售賣。我們現在更多還是通過人與人聯系這樣的形式，未來Agent 之間甚至能實現自動任務定價。雖然這種模式在短期內不會完全成熟，但應該會有這樣的項目出現。

岑峰：最近“將離職員工煉化為數字化員工”的說法很火。常楠老師，在商業落地中，這種“知識蒸餾”是否已經從自媒體想象進入了實操階段？

常楠：在傳統大型組織中，這種“蒸餾”其實一直以崗位備份和文檔交接的形式存在，沒有任何一個人是完全獨享同一個崗位的知識，一定有一個Backup，這本身也是一種知識的蒸餾，以前在隱性里面就已經都存在了。

現在的技術讓這種過程變得更智能、更具象。但我認為，相對于內化到模型中的能力，“持續學習能力”可能才是更重要的，他已經研究出來的知識可以沉淀下來，但可能很快就會擴散失去價值，持續學習的能力才是核心資產。

另外像人脈關系，銷售的關系能力有時候也是很難沉淀、很難被模型蒸餾出來的，其價值在于無法被接管的客戶信任關系。因此，數字化員工可能在重復性崗位上有意義，但對于核心人才的替代作用有限。

岑峰：閉源巨頭一直主打安全與免運維，但 Claude Code 源碼泄露事件暴露了其脆弱性。這是否會動搖企業對閉源托管方案的信任？

常楠：私有化部署一定是有大量市場的，但是這個成本商業成本非常高。信任與部署方案之間存在一個“光譜”，可能都會有各種生態的存在：大型企業擁有資金和 AI 團隊，出于對代碼主權和可審計性的考慮，一定會追求私有化部署。而中小企業受限于算力、成本和工程能力，云端方案依然是極其廉價且高效的替代品。

所以并非一個絕對的選擇題，它是一個有灰度的問題。在不同的場景下，根據不同公司的狀態，還有他們業務的狀態，實現業務狀態和成本敏感度的動態平衡。

岑峰：現在巨頭的底牌被看清之后，Agent創業者會不會迎來一個平權的時代？如果真的有一個平權時代的到來，這對創業者會有怎樣的機會呢？

常楠：我同意佳釔剛才說的，Claude Code代碼泄露可能有一定的價值，但它也不是絕對的價值。你要說平權，我覺得也不一定平權，因為模型能力本身還是決定了產品的上限，而工程能力決定了產品的下限。如果基座模型糟糕，工程再強也難有作為。

但泄露的代碼確實為開發者提供了極佳的案例。比如一些開發者在某一些領域里面有獨特的領域Knowhow和數據，但在如何在工程層面實現低成本的內存機制、上下文管理、編排邏輯及安全機制上缺乏經驗，這對缺乏相關積淀的公司極具參考價值。

岑峰：很多人擔心開源 Agent 最終會淪為閉源大廠的“免費測試員”。佳釔，未來是否可能出現一個繞開大廠“生態稅”的去中心化應用網絡？

張佳釔：邏輯上，模型廠商確實有能力通過數據優勢“吞掉”新出現的能力。去中心化的 Agent 網絡一定會出現，但可能無法完全繞開 OpenAI 或 Anthropic。因為追求極致能力的用戶永遠無法避開最頂尖的閉源模型。

我認為創業者的思路需要轉變：不要指望干掉巨頭，而要為 Agent 打造基礎設施（Infra）。與其在更通用的 Computer Use 領域硬碰硬，不如去為 Agent 創造更快速、更原生的 CLI 工具和底層組件。通用 Computer Use 雖然范圍廣，但效率較低，為 Agent 定制的基礎設施才是當下的藍海。

岑峰：當大廠開始提供工業級 Agent 服務時，創業者的價值是否會從功能提供轉向行業 Know-how 的沉淀？常楠老師，你會如何選擇方向？

常楠：行業深度和強化學習（RL）算法能力缺一不可。像佳釔說我有獨特的數據，然后知道怎么構建這個系統，這樣可以在行業里有一個獨特認知的Finetune的模型，可能會有一定的壁壘。但必須警惕，如果某個垂直行業的商業價值足夠大，大廠很快就會帶著資源蠶食該市場。

作為效率工具或問題解決類企業，與客戶的核心關聯在于長期信任積累。唯有承接大企業不愿做的 “臟活累活”，才能建立專屬信任，促使客戶開放獨特的上下文、數據與工作流，進而構建專屬智能體系統，以更低成本實現高效落地，形成差異化優勢。

但這一模式面臨雙重擠壓：一方面，Claude Code 等編碼能力的崛起，使得客戶企業可能自主搭建系統，形成內部替代；另一方面，上游模型廠商會向下拓展，下游客戶企業會向上自建，創業公司的生存空間被大幅壓縮。

若單純做通用型 Agent 企業，無論是 ToB 還是 ToC，挑戰都極大。ToB 領域易受上下游夾擊，ToC 領域用戶嘗試意愿低，且模型廠商必然覬覦大眾市場。唯有在特定垂直領域，構建通過 AI 生成的獨特內容能力，形成核心壁壘，才有可能挖掘商業機會。

岑峰：有觀眾提問，能否具體介紹一下哪些場景是大廠沒有關注的應用場景？

常楠：那些大的場景可能大廠都在關注，例如Sora類大場景、模型競爭及核心ToB領域，但像一些足AI娛樂、數字生命、Agent工作平臺等賽道，大廠短期不會踏足。因為他們還在糾結模型的戰爭和一些非常大的ToB領域，對ToC的場景現在覆蓋的還相對較少。

這類偏內容向的ToC場景，需人獨特的審美品味，而AI目前尚未達到內容基礎門檻，且模型廠商重工程、輕內容的文化，也讓其暫未布局。因此，若能憑借獨特品味做此類廣普ToC應用，仍有一定的市場機會。

岑峰：前段時間 OpenAI 關閉了 Sora 的某些預覽服務，這是否反映了某種信號？

常楠：巨頭的算力是有限的，Sora 的降溫反映了 OpenAI 在面對 Anthropic 等激烈競爭時需要收縮資源、聚焦核心戰略。此外，AI 生成內容的留存率低，是因為低質內容已嚴重過剩。創業者應利用比 AI 更獨特的 Taste 和對用戶需求的精準理解，去連接產品與人。

岑峰：過去的一小時里，我們見證了 Agent 競爭正從“模型智力”轉向“系統工程能力”。總結一下今天的討論：Agent正在從"模型智力"的競爭，轉向"系統工程能力"的競爭。無論是VLM還是CLI路線，無論是開源還是閉源，最終都要回到一個核心問題：你能為用戶創造什么價值？在這個"深水區"里，客戶關系、行業Know-how、持續交付能力，才是創業者的真正壁壘。感謝兩位嘉賓的深度分享。

Youtube鏈接：https://youtu.be/QGnynf82TRA?si=rE01vEtpxqQ8_0sp

未經「AI科技評論」授權，嚴禁以任何方式在網頁、論壇、社區進行轉載！

公眾號轉載請先在「AI科技評論」后臺留言取得授權，轉載時需標注來源并插入本公眾號名片。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.