抓住風口
本期要點:一場意外,卻會帶來Agent浪潮的加速
你好,我是王煜全,這里是王煜全要聞評論。
過去三年里,很多人都有一個感覺,AI模型看起來已經很強了,可要讓它連續完成更復雜的任務,結果總是差強人意。
目前,在這方面表現最好的,只有Claude,也讓Anthropic成為了當前最炙手可熱的公司之一。
最容易得出的解釋是,其他的模型還不夠強。但如果再深挖一步,會發現,也有另一種可能,那就是用模型的方法不對。
最近Claude Code的“被動”開源,或許讓大家第一次有機會看到Anthropic的優勢根源究竟在哪。
![]()
3月31日,有人在檢查Claude Code新版本時,意外發現了一份調試文件,其中幾乎保留了Claude Code完整的源代碼和系統結構。具體細節,我們昨天的文章中進行了較多介紹,今天不再贅述。
有趣的是,很快,就有開發者把文件下載下來,整理和補足了代碼,并將其發布到了開源社區之中。上線一天內,這些項目就獲得了接近十萬的關注,增長速度之快遠超大多數新的開源項目。
![]()
這說明,大家很快意識到,里面記錄的內容非常重要。
因為這次泄露的,是Claude Code的一整套工程系統,包含了Anthropic過去兩年一點點試出來的做法和經驗。
接下來,無論是OpenAI、xAI、谷歌,還是中國的AI公司,以及無數的開發者和初創團隊,都將可以參考這些方法,少走很多彎路,而這無疑將加速Agent浪潮的進程。
為何加速
首先,要指出的是,Claude Code這套成熟的工程方法被公開,就有可能讓整個行業的發展節奏發生飛躍式的變化。它降低了執行復雜項目的門檻,讓更多團隊可以嘗試已經驗證的方法。
類似的事情才剛剛發生過。
今年年初,OpenClaw推動了Agent時代的到來,但這并不只是創始人Peter Steinberger一人的功勞。
他最初公開的,只是一套相對粗糙、但可運行的Agent框架。不過很快,就有無數其他開發者補充了工具鏈,優化了任務拆解,嘗試了各種使用方法,并把不同模型接入系統,改進了上下文管理,彌補了底層架構的缺陷。
這種開放協作使得短時間內,OpenClaw生態里的項目數量和復雜度都實現了快速上升。
![]()
這說明,當一個基礎方法被公開,且有大量開發者參與其中時,就會帶來創新的爆發。
Claude Code雖是“被動”開源,效果卻會相似。
之前,Claude Code由于可以很好的完成復雜的開發任務,得到開發者的普遍青睞。
要知道,即便是OpenAI的Codex,寫一段代碼、改一個函數,和Claude Code的表現相差不大;但讓它接管整個項目,比如讀代碼、改代碼、跑測試、再根據結果繼續修改,就容易出現上下文混亂、執行中斷或越改越亂的問題。
Claude Code的核心創新在于構建了完整的工程化Agent框架(即Harness設計),實現了TAOR、也就是思考、行動、觀察、重復的循環機制,通過確定性的工程設計最大化地解決了大語言模型的幻覺問題,從而保證了復雜操作的可靠性和可控性。
這也讓Claude Code可以在設定的任務范圍內自動完成讀文件、修改代碼、執行命令等操作,并根據執行結果調整下一步的動作。這讓連續執行多輪任務成為可能,無需人工干預每一步,直到結果滿足了用戶的需求。
這次的代碼泄露,讓大家得以窺見Anthropic這一整套做法,讓更多開發者和團隊可以站在巨人的肩膀上快速構建自己的Agent系統,并進行試錯和迭代,從而將加快整個行業的創新節奏。
影響
那這又有什么影響呢?
我們認為,對Anthropic的影響不大,因為這次泄露的文件中并不包含Claude模型的訓練數據或核心算法,他們的核心競爭力并沒流失。
未來最先受到沖擊的,反而是像Cursor這樣夾在中間的一批公司。
Claude Code的出現,本就已經讓Cursor這樣的編程工具岌岌可危。它們既沒有自己的模型,也缺少明顯的垂直場景壁壘,本質上是在把模型接入開發流程,依靠先發優勢和工程經驗留住用戶。
可是,禍不單行,這次代碼的泄露,會導致大量模仿Claude Code的項目出現。AI編程將不再是幾家大公司的天下,Cursor的競爭對手將大量涌現。
不過,對于頭部模型公司來說,這次泄露事件卻可能是個利好。
OpenAI、xAI以及谷歌一直在努力提高模型在復雜任務下的表現,可是效果一直不如Anthropic。
現在,他們可以參考Claude Code的工程方法,快速追平差距。到時候,如果編程表現還是不行,可能就真的是模型性能不如人了。
但我們更想強調的是,類似的,中國也迎來了一個關鍵的窗口期。
過去,人們常說中國模型與美國相比,大約差6個月。看似時間不長,但也導致我們的模型難以進入開發者的工作流中,出現一步慢、步步慢的尷尬局面。
同樣是Claude Code,配合Claude模型,可以完成復雜項目;但如果換成國內的模型,比如Kimi、GLM,雖然價格便宜了,也能應付一些基礎任務,但在復雜開發場景下表現明顯就不行了。
可在以前,大家很難判斷,差距是模型能力不足,還是方法不當。
現在不同了,Claude Code工程方法的各個關鍵環節已經一目了然,中國企業終于可以客觀評估本土模型與Claude之間的差距。
一方面,可能要不了多久,大家就會發現,很多所謂模型能力的差距,其實源于工程能力的差距。一旦方法補齊,實際體驗的差距可能迅速縮小。
另一方面,即便模型能力有所不足,我們也有望基于自己的模型特性,進行針對性的工程優化和架構調整。只要方法對了,也有望在較短時間內逼近一線體驗。
而且,不僅是編程領域,從電商、金融到工業自動化,中國在每個行業都有大量垂直應用場景。
模型能力和工程能力提升后,企業將有望針對各類場景構建Agent產品,通過快速迭代、并行試錯和工具鏈優化,將模型能力轉換為可交付的應用體驗。
換句話說,我們有機會用“80%的模型能力”,結合“100%的工程執行力”,以低得多的價格提供接近一線的用戶體驗,從而在這輪AI應用化的新發展階段中占據先機。
所以,估計這個假期,我們的開發者們都在忙著加班吧?也歡迎在評論區分享你的近況。
以上就是今天的內容,最后做個小廣告。5月份,我們創新地圖將組織一個硅谷游學考察團,去AI創新最密集的地方,看看好的項目和公司,跟牛人做個深度對談和鏈接。如果你有興趣有時間,歡迎跟我們一起,名額有限,快快掃碼報名!
更多的科技產業新趨勢和底層規律,歡迎加入科技特訓營學習,和我一起,先人一步,領先一路!
王煜全要聞評論,我們明天見。
硅谷AI考察,請掃碼報名↓
↓長按圖片掃碼報名,先人一步,領先一路
麻煩花十秒點一下這兩個問題,一起來看看Agent時代的真相
最后, 鑒于公眾 號推送機制的改變,你未來刷 到要聞評論的機會可能沒那么多了,建議你加入粉絲群,第一時間 得到我的獨家前沿分析,而且我們還會每天在粉絲群里發布獨家資料,快快掃碼加入吧!
![]()
此外,我們還為您準備了一個思維導圖,掃描加群即可領取
“Agent時代的企業和員工”
↓點擊學習王煜全老師最新大師課,掌握馬斯克的賺錢底層邏輯!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.