![]()
2024
或許你還記得,在并不遙遠的2024 年,Kimi是中國AI當紅炸子雞:10億美金融資、Kimi概念股多次漲停、200萬字輸入碾壓GPT、激進的投流推廣策略。
但他們當時獲得的曝光度,遠超自己的技術影響力。
事實上,那個200萬字的模型,后來能用到的人微乎其微。后來了解到,那是個實驗性模型,每次運行成本接近 3 位數,完全不具備大規模服務用戶的可能性。
那時的技術圈,對 Kimi 是不屑一顧的。
但是靠著200萬字的噱頭,Kimi還是站住了「長文本」標簽和用戶心智。
2025
2025 年初,DeepSeek 橫空出世,真正靠技術實力成為中國AI技術的代言人。
到了 2025年中,Kimi 已快一年沒任何融資的消息。被「唱衰」成為主旋律,員工開始流失,業內基本給這個創業項目判了死刑。
如果你從2025年年中開始,閉關了 9 個月,到2026年3月看到新聞:
Kimi 最新估值 1200 億;
Kimi 20 天收入超過去一年;
Kimi的模型被3500億估值的最火AI編程工具Cursor套殼并實錘(你閉關了9個月,所以不知道最火的AI編程工具已經是 Claude Code了,Cursor已成老二);
Kimi新模型被承載了互聯網20%流量、市值超過 5000 億Cloudflare引入為主力模型;
Kimi新模型成為全球最大獨立AI搜索應用Perplexity唯一引入的開源模型和中國模型;
Kimi新技術「注意力殘差」開始改造深度學習架構10多年來的地基,并得到前OpenAI的聯合創始人Andrej Karpathy、OpenAI推理模型之父 Jerry Tworek 以及馬斯克稱贊;
楊植麟成為英偉達2026 GTC年度大會唯一受邀做演講的全球獨立大模型公司代表……
你很可能會驚掉下巴。
大家說「AI 一天,人間一年」,AI 領域 9 個月確實發生了很多事情。
但歸根結底是一件事情,AI技術的范式發生了變化。這個變化最常見、最偷懶的概括是從 Chat 到 Agent。
對全世界的 3000萬程序員來說,變化是,最受推崇的工具從Cursor 變成 Claude Code。
對總是率先擁抱新技術的 early adopter 來說,變化是更頻繁地打開那個類似 DOS 系統的黑白命令行終端……
對AI公司來說,變化是大家陸續發現:更會聊天的模型,遠不如會寫代碼和調用工具的模型有價值。
最酷的產品從ChatGPT變成Claude Code,最酷的創業公司也從 OpenAI 變成了 Anthropic。
回到 2025 年初的中國市場。
DeepSeek R1 因為復刻并開源了 OpenAI o1 的「深度思考」能力爆火,另一個「通用 Agent」產品 Manus 也橫空出世……
彼時的中國AI公司,大多數在忙著復現 DeepSeek R1,推出能「深度思考」的新模型。少數公司意識到 Manus 背后的那個模型,才是更值得花資源「復現」的東西。或者意識到了,但沒有分配到足夠的資源,或找到方法。
Manus的一個很大的價值,就是可視化呈現了Claude模型的多輪工具調用能力。正如一位大模型公司的技術專家在自己的博客中寫到,「絕大多數 Agent 產品,離了 Claude 以后,什么都不是。」
直到 2025年7月,中國第一個主打Agent能力的模型才悄然出現。7月11日,Kimi K2 發布,喊的是 Open Agentic Intelligence。這里顯然藏著他們的野心:復現 Claude 模型的 Agent 能力,并開源出去。就像 DeepSeek R1 復現 OpenAI o1并開源出去。
發布 5 天后,7月16日,英國的 Nature 自然雜志發現了這個模型的價值,用「另一個DeepSeek時刻」來形容。
發布10天后,7月21日,Anthropic聯合創始人Jack Clark在自己的博客中介紹了 K2,評價稱:
在我看來,Kimi 是一款還不錯的模型,落后美國最前沿幾個月,延續了 DeepSeek 的軌跡。其編碼和工具調用分數已足夠高,我預計現實中會有人真正用它,因此觀察其采用率能折射競爭力。
7 月底,楊植麟在播客專訪中,解釋了 K2 為什么沒有先做「深度思考」,而是在 Agent 需要的編程和工具調用能力上發力。他用「缸中之腦」來形容主打深度思考的模型。對了,楊植麟這篇采訪值得多看幾遍,他講了很多技術層面更本質的東西,比如編程和Agent的關系,思考和工具調用的關系。
因為 K2 和后續 K2 Thinking 模型的表現,Kimi 的融資在年底終于續上了,5 億美金,IDG和幾家老股東繼續加持。
2026
2026 年春節前后,這個瘋狂的大模型發布季,Kimi 是第一個交卷的選手。可能也是讓同行們最難受的一個,因為 K2.5萬億參數、圖片和視頻的多模態理解能力,支持思考和非思考模式。其他創業公司同行發布的都是純文本模型。有實力把多模態能力融入旗艦模型的,只有大廠的閉源模型。
3月16號,Kimi團隊發布了Attention Residuals的技術論文,挑戰已有 10 年歷史的神經網絡底層殘差連接機制。OpenAI的聯合創始人Andrej Karpathy銳評Kimi「讓我們意識到根本沒有把Attention is All You Need理解透徹」,要知道,Attention is All You Need就是開啟大模型時代的圣杯,哪怕考慮到AI圈的通詞膨脹,這個評價也是前所未有的高。據說,論文第一作者是一位僅 17歲的高中生,天才出少年,真是令人感慨。
3月17號,Kimi 模型繼年初的 CES 2026 之后,在黃仁勛的 GTC 2026 主旨演講中再度成為英偉達展示下一代芯片和推理性能的御用模型。
![]()
3月18號,作為英偉達的GTC年度大會唯一受邀的中國獨立大模型公司代表,楊植麟的現場演講全是干貨,上來就把優化器、注意力機制、殘差連接三大核心模塊比作有8-11年歷史的陳舊技術標準,是繼續Scaling的障礙,用新的技術突破表明「每一項基礎技術都值得重新思考」。
然后是這幾天人盡皆知的「Cursor丑聞」,誰能想到,估值500億美金的全球最大編程助手Cursor,重磅推出的新一代編程模型Composer 2——跑分超過Claude Opus 4.6——竟然是套的Kimi K2.5的殼??
身為Token中介定位的Cursor之所以要發力「自研」,主要還是為了擺脫它對Anthropic和OpenAI的高度依賴,卡脖子這事兒可不分國界,Anthropic也真的曾經斷供Windsurf這類編程工具,在既當裁判員又當運動員的環境下,Cursor希望獨立自主的心情,完全可以理解。
只是能力和愿景之間的巨大鴻溝,讓Cursor選擇了抹掉來自Kimi的底座模型名字,靠代筆求融資,事情最后也算是體面收場,Cursor的聯合創始人公開道歉,在技術報告中給除了選擇 Kimi K2.5 作為底座模型的詳細理由,而Kimi官方也回應表示,很高興Cursor使用Kimi K2.5作為基座,雙方通過推理服務商 Fireworks AI 做了技術授權。
根據小道消息, 2026 年春節前后,Kimi 陸續以投前 48 億美元、60 億美元、100億美元的估值完成總額近 20 億美元的融資,3月份開啟的 180 億美元輪次份額也要排隊才能拿到。
這當然也受益于兩個同行在港股的超常表現,但更重要的還是靠自己的 K2和后續的模型實際表現,包括前文題庫的 Cursor、Cloudflare、Perplexity、黃仁勛、馬斯克、馬克·安德森、查馬斯等不斷發來的「金水」,以及K2.5發布后20天收入超過過去一年的財務表現。
一位 Kimi 的朋友在私下聊天里說,制約業務發展的只有算力,現在至少還有 10 倍的需求沒有滿足。有多少卡,就能有多少收入。據我跟另一個大廠工作的朋友了解,現在有些大廠在編程工具中接入的Kimi模型,甚至要通過預購才能拿到足夠的額度。
這 9 個月,Kimi 算是完成了一次逆天改命。
DeepSeek V3不是一天煉成的。其背后的幻方量化基因,決定了他們從 2023 年起就走上了一條與硅谷截然不同的極致能效比之路。在 2023 到 2024 年的大部分時間里,他們游離于主流敘事之外,潛心自研 MLA(多頭潛在注意力機制) 與 DeepSeekMoE 架構,試圖在有限的算力下壓榨出超越物理極限的性能。直到 2025 年成就自己,也給其他AI創業公司帶來信心。
所有人都在期待 DeepSeek 的下一代模型繼續驚艷全場,但媒體上三番五次的「狼來了」把戲只會消磨大家的注意力。技術突破,哪是那么容易的事情,我們完全有理由更有耐心地等待 DeepSeek 團隊的下一個作品。
Kimi K2 也不是一天煉成的。他們實際上跟 DeepSeek R1同一天發布了無人問津的K1.5模型,被OpenAI官方認為是率先復現o1的兩個公司之一。他們在被唱衰最厲害的2025年初發布了Moonlight系列小型MoE模型,用來驗證下一代二階優化器技術,并且最終應用到萬億的K2模型上。現在Muon已取代已經用了10年的標準技術Adam,成為Kimi、GLM-5、DeepSeek Engram在內的新模型都開始采用的新標準。
正所謂,「出來混,總要還的。」Kimi 在2024年提前享受了C位和曝光,2026年沒再復現該屬于自己的流量。
各有各的命。
作為兩家幾乎同時起步的創業公司,我佩服他們那種從來不認為市場格局已定、相信技術才是最大變量、敢于追逐AGI 的勇氣和年輕生猛、戰績可查、永遠相信細水長流的力量。
即使站在 2026年3月底這個時間節點看,2022年底開始的這場AI革命也才進行了3年半的時間,一切才剛剛開始。為什么下一個 OpenAI 和 Anthropic 不能是一家中國公司?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.