上周,OpenAI 和 Anthropic 分別發布了一份,兩個報告有一點給我印象非常深:使用 ChatGPT 的用戶行為中非工作消息的比例越來越大,已經占到了差不多 73%;
而使用 Claude 的用戶行為中則幾乎都與工作相關,AI 更多被當作工具/助手/協作者,特別是與編程以及增強人類能力這塊。
兩家走出了非常具有自己特色的路徑:OpenAI 的發展一直延續了綜合能力的提升,在推理和多模態各方面全面發展。而 Anthropic 則以代碼和工具使用能力為特色,逐步形成適合真實世界軟件工程任務的口碑和標簽。
![]()
OpenAI 最新一輪融資讓其估值達到了 3000 億美金,而 Anthropic 同樣達到了 1830 億美金,可以說都挺瘋狂的。
成為 Anthropic 不比追趕 OpenAI 容易
Anthropic 的發力和快速突破點是 Coding 和 Agent 能力,目前它是 Agentic Coding 這個領域的主導,自己推出的 Claude Code 也成為 Agentic Coding 里增長最快的產品,6 個月時間 ARR 達到 4 億美金,Claude 4 上線后兩月內其收入增長了 5 倍。
最近在跟一位朋友交流國內 AI 大模型未來的機會點時聊到一個反常識的觀點:大家可能會覺得追趕 OpenAI 的難度要高于 Anthropic,因為前者需要同時滿足天時地利人和的條件,而后者需要的是單點突破的能力。但實際上,做 Anthropic 的難度更大,因為作為追隨者,大家很容易困在行業領頭羊 OpenAI 設定好的技術路線圖,亦步亦趨。敢于提出和驗證不同的路徑才有可能成為 Anthropic。
這可能就是為什么直到最近幾個月,中國的AI模型公司才意識到 OpenAI 的路線不是唯一正確解,從而加快了追趕 Anthropic 的步伐。
7月初,月之暗面發布的 Kimi K2,技術博客標題就叫 Open Agentic Intelligence。并且在官方文檔中首次提供了與 Claude Code 完整兼容的接入指南,可以直接在 Claude Code 中使用 K2 模型。
7月末,阿里的 Qwen3-Coder 編程模型以及智譜發布的 GLM-4.5,都在往替代 Claude Code 的方向上靠。
8月底,DeepSeek 發布的 DeepSeek-V3.1,也包括了兼容 Anthropic API 的能力,可以用與調用 Claude / Anthropic API 類似的方式調用 DeepSeek 的模型和服務。
9月初,Anthropic 嚴格限制來自中國企業的使用后,國內 AI 迅速做出了反應,希望成為 Claude 的有力替代。
Anthropic 如何成功挑戰 OpenAI 設定的技術路線圖?答案要從一年多之前說起。
Anthropic 的賭注
2024年3月,Anthropic 在發布 Claude 3 系列模型的時候,依然是 OpenAI 的追隨者,除了強調更長的上下文,模型本身并沒有什么特別突出的能力,官方強調的也是跟 OpenAI 一樣的各項通用能力。
三個月后,Anthropic 模型策略的轉折點開始顯現。2024 年 6 月發布 Claude 3.5 Sonnet 的時候,Anthropic 第一次提出了內部的 Agentic Coding 評估基準,突出了模型在真實世界中修復代碼庫中的錯誤或添加功能的能力,重點強調“在得到指導并提供相關工具時,Sonnet 3.5 可以獨立編寫、編輯和執行代碼,具備復雜的推理和故障排除能力。它輕松處理代碼轉換,使其在更新遺留應用程序和遷移代碼庫方面特別有效。”
![]()
2024 年 10 月,新版的 Claude 3.5 Sonnet(沒錯,這是個糟糕的產品名字,后來他們應該吸取了起名字的教訓),通過 Computer use 功能,將模型“工具使用”能力提升到了一個新的階段。這一次他們開始的全部重點都是“業界領先的軟件工程能力”。OpenAI 在 8 月份發布的 swe-bench Verified 基準評測,成了 Anthropic 模型最看重的一項能力展示的窗口。這可能會讓人想起 Google 發布的 Transformer 成就了 OpenAI 的 GPT 系列模型。AI 研究的開放,促進了行業的快速發展,讓大家可以互相成就。
2024 年 11 月,Anthropic 發布了模型上下文協議(Model Context Protocol),讓模型的工具使用能力有機會規模化擴展。后來,這個協議幾乎成為了行業里事實上的標準,Google、OpenAI 都宣布兼容,大量廠商推出了自己的MCP工具。
再后來,Claude 3.7、4.0、4.1 模型陸續發布,基于 Claude 模型的 Cursor 等編程工具成為行業熱門產品,自己下場做的 Claude Code 第一次把 Agentic Coding 能力更淋漓盡致地呈現在行業面前。
至此,Anthropic 讓 OpenAI 成為了 Agentic Coding 領域的追趕者,也把自己的估值推上了近 2000 億美元的驚人水平。
避免困在 OpenAI 設定的路線圖里
Anthropic 找到了突圍點,但 AI 行業的其他公司被困在 OpenAI 設定的路線圖里。DeepSeek R1 帶來的沖擊,更是讓大家普遍堅信只有把 L2 的“深度思考”能力做好了,才有機會進入 L3 的 Agent 階段。
![]()
Kimi 的創始人楊植麟最近在接受《語言即世界》的采訪時,多次 cue 到了 Anthropic 和 Claude 模型,他點出 Anthropic 并沒有完全按照 OpenAI 設定的 L1 到 L5 路線發展,在 L2 的推理上做得并不多,而是著重在 L3 Agent 上發力,最終取得了突破。這可能也是為什么 Kimi 的 K2 模型發力 agentic 能力,而不是優先做長思考版本的原因。
追隨領頭羊是一個更不需要思考的戰略。如果一個中國公司的戰略是緊緊跟追 OpenAI,那它幾乎必然會困在 OpenAI 設定的路線圖里,在 Agent 模型方面慢半拍到一拍。對于中國 AI 大模型創業公司而言,融資金額普遍有限,出牌的機會并不多,可能慢板拍就意味著掉隊的開始。
這讓我想起了張一鳴在某次采訪中說過的一段話,“對事情的認知是最關鍵的,你對這件事情的理解,就是你在這件事情上的競爭力。因為理論上其他的生產要素都可以構建。”一個更直白的版本是,除了認知,其他生產要素都是可以構建的。
想要避免困在別人設定的路徑里,中國 AI 行業需要更多像梁文鋒和楊植麟這樣的深度思考者,就像 DeepSeek 對模型 MoE 架構的探索,Kimi 對下一代深度學習優化器的探索。
月之暗面的 Kimi 模型,最早以“長文本”理念被人所知。2023 年 10 月,Kimi 剛上線時就打出了支持 20 萬字輸入的理念。是當時上下文最長的 AI 助手產品,大概是當時 Claude 的兩倍。楊植麟甚至提出了“Lossless Long Context is Everything”的說法,這讓人想到其實他的學術成名作 Transformer-XL,本質目的就是讓模型從底層算法層面就能支持更長的上下文。
2025 年 1 月,跟 DeepSeek R1 同一天推出“長思考”的推理模型 K1.5 沒什么聲響,直到 7 月份開源了萬億參數的 Kimi K2 模型,獲得技術圈的普遍認可,甚至被 Nature 發文稱是中國的“又一個 DeepSeek 時刻”。在采訪中,當被問到 Kimi 是否想成為 Anthropic 時,楊植麟回答說,“做中國的 XXX”本身就是不成立的——“很難用這樣的方式去定義。中美的語境、土壤不一樣,今天更多是從全球視角去思考問題。”
對中國 AI 公司而言,Anthropic 帶來的最大價值或許就是激勵更多人,不僅僅做追隨者,而是探索屬于自己的道路。
Anthropic 可能也不是最終答案
如果站在 OpenAI 的角度,Anthropic 的成功顯然是一次偷襲,他們被對手打到了一個自己不夠重視的領域。他們最近的回應是 GPT-5-Codex ,一個專門針對軟件開發優化的模型,以及 Codex CLI 工具。從開發者的反饋來看, GPT-5-Codex 與 Claude 模型的體驗有所不同,GPT-5 更側重于深入思考之后,再采取行動,而 Claude 更側重于邊采取行動邊思考。對于很多高難度任務而言,思考清楚再動手,可能是更好的選擇。
所以,Claude 也不一定就是軟件工程的最終答案,對于中國的 AI 公司而言,沒有野心的追隨者,永遠只能是追隨者。
End!
加入 MemoPro會員,獲取更多趨勢信號
Memo: Signal, not noise!
訂閱 Memo Pro
Memo(vcsmemo.com)是一個基于付費訂閱模式的創投內容平臺,已得到大量 VC、企業 CEO 以及高管的支持,我們希望幫助你捕捉最具價值的行業信號、過濾噪音(Signal,Not Noise)。
訂閱 Memo Pro
你將獲得:
1.解鎖未來一年以及之前的所有會員專屬內容
2.郵件訂閱功能:付費內容+最新行業快訊+...
3.優先體驗 Memo 新產品和新功能
限時 799 元/年(原價 999 元/年),掃碼立即訂閱
1.
2.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.