![]()
產業競爭的烈火終究是燒到了大模型上,前段時間,知名編程模型Claude的開發商、估值超過3500億美元(約合25000億人民幣)的Anthropic公司選擇對華“斷供”。而且不僅是對中國企業,也明確指出包含中國公司持股的海外企業。
國內企業陸續被暫停了Claude API使用,紛紛尋找替代品。包括字節跳動的TRAE和騰訊的CodeBuddy等編程平臺的國內版,也被迫下架Claude模型,一時間風聲鶴唳。
在大模型百花齊放的今天,Claude斷供中國真的如此關鍵嗎?答案是肯定的。
Claude之所以難以被替代,源于其深厚的技術積淀。在復雜算法實現和系統架構設計等高級編程任務中,Claude有更高的完成度,跨越了編程領域“可信”和“可靠”的心理閾值。
然而,機遇往往與危機并存。
![]()
1月底,一家中國大模型公司發布的新開源模型,因為突出的編程性能和視覺理解能力,引發了海內外技術社區和開發者的廣泛關注。
連續一周登上Twitter科技新聞熱搜,僅僅三四天時間,官方發布帖子的閱讀量就達到了 680萬,甚至不亞于美國OpenAI和Anthropic的旗艦模型發布帖子。頂尖AI技術領袖,160萬粉絲的前特斯拉AI總監Andrej Karpathy、卡內基梅隆大學教授Tim Dettmers等專家也點贊恭喜。
![]()
從AI行業權威的評測機構LMarena(大模型匿名競技場)代碼能力基準測試中,這個名為Kimi K2.5的中國模型,排在全球開源模型的第一位,僅次于Claude和谷歌Gemini最新的旗艦模型。在前10名的榜單中,也是唯一的中國模型。
![]()
美國大模型技術最好的三家公司:OpenAI、Claude和Gemini,因為旗下模型的性能和實際表現總在排行榜的前列,通常被行業稱為美國“御三家”。
這是第一次,中國公司通過開源模型打破了美國“御三家”的編程和視覺理解技術壟斷。
美國另一家權威評測機構Artificial Analysis和中國模型基準測試機構SuperCLUE的分析都顯示,Kimi K2.5模型的智能水平是全球開源第一,僅次于閉源的美國“御三家”。
在特別注重編程性能的AI領域,但凡有一款大模型做到關鍵指標領先,就會被迅速推開。
Kimi K2.5一經推出后,海外知名編程工具Kilo Code就迅速接入,并宣布首周免費來吸引用戶。國內,騰訊旗下編程工具CodeBuddy、字節跳動旗下編程工具TRAE也第一時間上架,因為突出的編程能力,和同時支持視覺的完備性,立即成為首選國產模型。
![]()
而發布Kimi K2.5模型的這家中國創業公司,卻有個略顯“中二”的名字,叫月之暗面。2025年底,他們剛剛完成了C輪35億元的融資,公司總估值在350億左右。僅為Anthropic 2.5萬億的1/70。
![]()
和很多工業軟件一樣,在編程大模型領域,中國的業界曾經也處于被卡脖子的狀態。
據行業評測數據顯示,Claude在復雜算法實現、系統架構設計等高級編程任務中的完成度顯著高于行業平均水平。在市場生態方面,Claude也因為先發優勢,構建了完整的開發者服務體系,形成了顯著的用戶粘性,特別是大型企業用戶的年均續約率更高。
也正是基于這些優勢,Claude的相關模型價格高了國內5-7倍。
那么貴,為什么不用國產?
不得不承認,在這個中國模型亮相之前,國產編程模型存在明顯的技術差距。
首先是模型的智能水平,海外模型基本都是萬億參數起步,才能做到對廣泛任務和高難度任務的較好應對。中國主要是幾千億參數的模型,難以應對較為復雜的任務,只能做一些非常簡單的編程工作。
然后是,中國主流模型在架構設計上普遍采用純文本預訓練,缺乏視覺模塊的整體集成。這意味著模型無法理解圖像包含的語義信息,在需要多模態理解的場景中表現受限。
比如在前端開發領域。某大型電商平臺技術團隊曾進行對比測試:當要求模型根據UI設計稿生成前端代碼時,必須有很強視覺能力,才能準確識別設計稿中的布局關系、色彩體系和交互元素。
視覺理解能力的技術門檻主要體現在三個層面:首先是視覺信號編碼,需要將像素信息轉化為有意義的特征表示;其次是跨模態對齊,要求模型理解視覺內容與文本描述之間的關聯;最后是統一表示學習,需要建立共享的語義空間。
這些技術難題如同幾座大山,阻礙了國產編程模型的進階之路。
而在實際應用中,這種技術差距直接影響了開發效率。開發效率的差距進一步影響了產品的迭代速度,這在快速變化的市場環境中是致命的。
大模型不同于新能源汽車,要想超車,沒有技術以外的捷徑可走。
面對技術壁壘,中國公司選擇對大模型的底層架構進行革新。
比如Kimi K2.5采用了原生多模態架構,通過ViT+Transformer的混合編碼器實現圖像和文本的聯合表示,在模型底層實現了信號融合。
這種設計相比傳統的后期融合方法,在語義保持度和計算效率上具有顯著優勢,具體而言,模型在訓練過程中就建立了視覺與文本的深度關聯,而非簡單地將兩個獨立的模型輸出進行拼接。
此外,據了解,在Kimi K2.5模型的開發中,這家公司還重點優化了訓練基礎設施,通過重構強化學習框架,讓訓練效率提升數倍。
而在視覺理解能力的痛點上,Kimi K2.5更是實現了對Claude的反超:在界面設計稿轉代碼任務中,Kimi K2.5可準確識別組件的空間關系、樣式屬性和交互邏輯,代碼生成準確率超過Claude。
更為友好的是Kimi K2.5的定價:API調用的輸入價格為4元/百萬Token,僅為Claude中號模型Sonnet 4.5的1/5,大號模型 Opus 4.5 的1/8。
對于那些每年在大模型上砸數千萬元的互聯網企業而言,終于等到了一個全功能的、代碼和視覺能力都很強的Claude中國平替模型。
![]()
當然,一個大模型好不好用,性能到底受不受認可,最終都是市場來說話。
OpenRouter數據顯示,Kimi K2.5上線第二天即進入日活躍度前三。
![]()
全球最大、估值超千億的AI搜索創業公司Perplexity,第一時間上架了Kimi K2.5模型,作為給付費用戶的高級模型使用。在Perplexity平臺上,這也是唯一的中國模型。
![]()
從全球開發者的實際反饋來看,這個名為Kimi K2.5的模型,編程能力的表現非常突出, “可以挑戰Claude的中號模型Sonnet 4.5,略遜于大號模型Opus 4.5”,同時價格只有他們的1/5到1/8,性價比優勢突出。
知名編程工具Cline的開發專家Juan Pa發帖稱,他在一項實際編程任務中測試了Codex 5.2、Opus 4.5 和 Kimi K2.5三個模型,他的測試結果是“Kimi K2.5以38%的成本達到了約Opus 90%的質量。”
![]()
人工智能專家Mariusz Kurman則建議,“在項目計劃階段使用Opus4.5模型,在創建階段使用Kimi K2.5模型,可以達到最佳效果。”
![]()
在國內技術社區上,開發者們實測之后反饋稱,“Kimi K2.5多模態能力以及coding能力還可以的,作為Gemini Pro。Claude和GPT5.2 codex模型的替代也是不錯的。國產模型越來越好了。”
![]()
一直以來,很多人都以為在AI競賽上,美國企業主導基礎模型層,而中國企業只是擅長應用開發。
2025年初,DeepSeek的出現打破了這種判斷。2026年初,這家叫月之暗面的公司推出的新模型,則在編程這個關鍵領域再次突破了美國模型的壟斷。
事實上,這家公司并不是2026年初才橫空出世的。早在2025年中,他們就因為首個萬億參數的開源模型K2受到了國際社會的關注,被英國自然雜志稱為中國的另一個DeepSeek時刻。
而在硅谷廣受歡迎的All-In Podcast中,Kimi K2.5也被直接定義為“開源AI的重要里程碑”。
![]()
硅谷知名的風險投資家、企業家Chamath Palihapitiya將Kimi K2.5的發布和帶來的反響概括為“Kimi K2.5時刻”。
作為一位曾參加白宮科技圓桌會議并采訪過美國總統的權威人士,Chamath認為,開閉源已不只是技術路線之爭,而是企業、組織乃至國家層面的“基礎設施選擇”。
由此可見,我們需要更多的DeepSeek時刻,需要看到更多中國力量的突破,不是一個DeepSeek,而是一大批DeepSeek。特別是在地緣政治不確定性的背景下,本土模型更是中國企業的剛需,因為在核心系統中采用自主可控的AI技術,既是商業選擇,也是戰略必須。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.