網易首頁 > 網易號 > 正文申請入駐

350億vs25000億！國產模型正打破美國AI編程壟斷

2026-02-02 18:15:57　來源: 無相商業趨勢

安徽舉報

分享至

產業競爭的烈火終究是燒到了大模型上，前段時間，知名編程模型Claude的開發商、估值超過3500億美元（約合25000億人民幣）的Anthropic公司選擇對華“斷供”。而且不僅是對中國企業，也明確指出包含中國公司持股的海外企業。

國內企業陸續被暫停了Claude API使用，紛紛尋找替代品。包括字節跳動的TRAE和騰訊的CodeBuddy等編程平臺的國內版，也被迫下架Claude模型，一時間風聲鶴唳。

在大模型百花齊放的今天，Claude斷供中國真的如此關鍵嗎？答案是肯定的。

Claude之所以難以被替代，源于其深厚的技術積淀。在復雜算法實現和系統架構設計等高級編程任務中，Claude有更高的完成度，跨越了編程領域“可信”和“可靠”的心理閾值。

然而，機遇往往與危機并存。

1月底，一家中國大模型公司發布的新開源模型，因為突出的編程性能和視覺理解能力，引發了海內外技術社區和開發者的廣泛關注。

連續一周登上Twitter科技新聞熱搜，僅僅三四天時間，官方發布帖子的閱讀量就達到了 680萬，甚至不亞于美國OpenAI和Anthropic的旗艦模型發布帖子。頂尖AI技術領袖，160萬粉絲的前特斯拉AI總監Andrej Karpathy、卡內基梅隆大學教授Tim Dettmers等專家也點贊恭喜。

從AI行業權威的評測機構LMarena（大模型匿名競技場）代碼能力基準測試中，這個名為Kimi K2.5的中國模型，排在全球開源模型的第一位，僅次于Claude和谷歌Gemini最新的旗艦模型。在前10名的榜單中，也是唯一的中國模型。

美國大模型技術最好的三家公司：OpenAI、Claude和Gemini，因為旗下模型的性能和實際表現總在排行榜的前列，通常被行業稱為美國“御三家”。

這是第一次，中國公司通過開源模型打破了美國“御三家”的編程和視覺理解技術壟斷。

美國另一家權威評測機構Artificial Analysis和中國模型基準測試機構SuperCLUE的分析都顯示，Kimi K2.5模型的智能水平是全球開源第一，僅次于閉源的美國“御三家”。

在特別注重編程性能的AI領域，但凡有一款大模型做到關鍵指標領先，就會被迅速推開。

Kimi K2.5一經推出后，海外知名編程工具Kilo Code就迅速接入，并宣布首周免費來吸引用戶。國內，騰訊旗下編程工具CodeBuddy、字節跳動旗下編程工具TRAE也第一時間上架，因為突出的編程能力，和同時支持視覺的完備性，立即成為首選國產模型。

而發布Kimi K2.5模型的這家中國創業公司，卻有個略顯“中二”的名字，叫月之暗面。2025年底，他們剛剛完成了C輪35億元的融資，公司總估值在350億左右。僅為Anthropic 2.5萬億的1/70。

和很多工業軟件一樣，在編程大模型領域，中國的業界曾經也處于被卡脖子的狀態。

據行業評測數據顯示，Claude在復雜算法實現、系統架構設計等高級編程任務中的完成度顯著高于行業平均水平。在市場生態方面，Claude也因為先發優勢，構建了完整的開發者服務體系，形成了顯著的用戶粘性，特別是大型企業用戶的年均續約率更高。

也正是基于這些優勢，Claude的相關模型價格高了國內5-7倍。

那么貴，為什么不用國產？

不得不承認，在這個中國模型亮相之前，國產編程模型存在明顯的技術差距。

首先是模型的智能水平，海外模型基本都是萬億參數起步，才能做到對廣泛任務和高難度任務的較好應對。中國主要是幾千億參數的模型，難以應對較為復雜的任務，只能做一些非常簡單的編程工作。

然后是，中國主流模型在架構設計上普遍采用純文本預訓練，缺乏視覺模塊的整體集成。這意味著模型無法理解圖像包含的語義信息，在需要多模態理解的場景中表現受限。

比如在前端開發領域。某大型電商平臺技術團隊曾進行對比測試：當要求模型根據UI設計稿生成前端代碼時，必須有很強視覺能力，才能準確識別設計稿中的布局關系、色彩體系和交互元素。

視覺理解能力的技術門檻主要體現在三個層面：首先是視覺信號編碼，需要將像素信息轉化為有意義的特征表示；其次是跨模態對齊，要求模型理解視覺內容與文本描述之間的關聯；最后是統一表示學習，需要建立共享的語義空間。

這些技術難題如同幾座大山，阻礙了國產編程模型的進階之路。

而在實際應用中，這種技術差距直接影響了開發效率。開發效率的差距進一步影響了產品的迭代速度，這在快速變化的市場環境中是致命的。

大模型不同于新能源汽車，要想超車，沒有技術以外的捷徑可走。

面對技術壁壘，中國公司選擇對大模型的底層架構進行革新。

比如Kimi K2.5采用了原生多模態架構，通過ViT+Transformer的混合編碼器實現圖像和文本的聯合表示，在模型底層實現了信號融合。

這種設計相比傳統的后期融合方法，在語義保持度和計算效率上具有顯著優勢，具體而言，模型在訓練過程中就建立了視覺與文本的深度關聯，而非簡單地將兩個獨立的模型輸出進行拼接。

此外，據了解，在Kimi K2.5模型的開發中，這家公司還重點優化了訓練基礎設施，通過重構強化學習框架，讓訓練效率提升數倍。

而在視覺理解能力的痛點上，Kimi K2.5更是實現了對Claude的反超：在界面設計稿轉代碼任務中，Kimi K2.5可準確識別組件的空間關系、樣式屬性和交互邏輯，代碼生成準確率超過Claude。

更為友好的是Kimi K2.5的定價：API調用的輸入價格為4元/百萬Token，僅為Claude中號模型Sonnet 4.5的1/5，大號模型 Opus 4.5 的1/8。

對于那些每年在大模型上砸數千萬元的互聯網企業而言，終于等到了一個全功能的、代碼和視覺能力都很強的Claude中國平替模型。

當然，一個大模型好不好用，性能到底受不受認可，最終都是市場來說話。

OpenRouter數據顯示，Kimi K2.5上線第二天即進入日活躍度前三。

全球最大、估值超千億的AI搜索創業公司Perplexity，第一時間上架了Kimi K2.5模型，作為給付費用戶的高級模型使用。在Perplexity平臺上，這也是唯一的中國模型。

從全球開發者的實際反饋來看，這個名為Kimi K2.5的模型，編程能力的表現非常突出， “可以挑戰Claude的中號模型Sonnet 4.5，略遜于大號模型Opus 4.5”，同時價格只有他們的1/5到1/8，性價比優勢突出。

知名編程工具Cline的開發專家Juan Pa發帖稱，他在一項實際編程任務中測試了Codex 5.2、Opus 4.5 和 Kimi K2.5三個模型，他的測試結果是“Kimi K2.5以38%的成本達到了約Opus 90%的質量。”

人工智能專家Mariusz Kurman則建議，“在項目計劃階段使用Opus4.5模型，在創建階段使用Kimi K2.5模型，可以達到最佳效果。”

在國內技術社區上，開發者們實測之后反饋稱，“Kimi K2.5多模態能力以及coding能力還可以的，作為Gemini Pro。Claude和GPT5.2 codex模型的替代也是不錯的。國產模型越來越好了。”

一直以來，很多人都以為在AI競賽上，美國企業主導基礎模型層，而中國企業只是擅長應用開發。

2025年初，DeepSeek的出現打破了這種判斷。2026年初，這家叫月之暗面的公司推出的新模型，則在編程這個關鍵領域再次突破了美國模型的壟斷。

事實上，這家公司并不是2026年初才橫空出世的。早在2025年中，他們就因為首個萬億參數的開源模型K2受到了國際社會的關注，被英國自然雜志稱為中國的另一個DeepSeek時刻。

而在硅谷廣受歡迎的All-In Podcast中，Kimi K2.5也被直接定義為“開源AI的重要里程碑”。

硅谷知名的風險投資家、企業家Chamath Palihapitiya將Kimi K2.5的發布和帶來的反響概括為“Kimi K2.5時刻”。

作為一位曾參加白宮科技圓桌會議并采訪過美國總統的權威人士，Chamath認為，開閉源已不只是技術路線之爭，而是企業、組織乃至國家層面的“基礎設施選擇”。

由此可見，我們需要更多的DeepSeek時刻，需要看到更多中國力量的突破，不是一個DeepSeek，而是一大批DeepSeek。特別是在地緣政治不確定性的背景下，本土模型更是中國企業的剛需，因為在核心系統中采用自主可控的AI技術，既是商業選擇，也是戰略必須。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.