時隔半年,又一家中國AI創業公司給美國科技圈帶來沖擊波。由這家公司推出的新模型K2讓美國科技圈驚呼,中國人在計算資源限制下仍然能持續做出世界級的創新,世界迎來“又一個DeepSeek時刻”!
![]()
超越DeepSeek,國產大模型Kimi K2全球登頂
外媒:“又一個DeepSeek時刻”
7月11日晚,中國AI公司北京月之暗面科技有限公司(簡稱“月之暗面”)正式發布并同步開源了最新的大模型——Kimi K2。
![]()
K2開源模型的突然發布,像一顆深水炸彈,海內外AI圈瞬間炸鍋。這款大模型憑借強大的編程、智能體任務性能以及實惠的API價格,引發了硅谷及全球開源社區的高度關注,在發布后48小時內引爆市場:Kimi官網訪問量激增36億,開源社區Hugging Face下載量突破10萬次,超過了該平臺上的任何其他模型。
良好的使用體驗,也讓Kimi K2模型在海外技術社區上,收獲了大量好評。全球最大開源AI平臺Hugging Face聯合創始人托馬斯評價稱:“來自中國的Kimi團隊在過去幾個月推出的系列模型令人印象深刻,K2更是挑戰了閉源模型的極限。”
Allen人工智能研究所的機器學習研究員Nathan Lambert在社交媒體平臺Bluesky上評價到:Kimi K2是“世界上新的最佳開放模型”。
月之暗面的優異表現也獲得了英偉達創始人黃仁勛的關注,在北京參加鏈博會期間接受媒體采訪時,黃仁勛對DeepSeek、阿里巴巴Qwen、Kimi等中國大模型給予高度評價。
![]()
7月16日,英國《自然》雜志甚至對Kimi K2進行了專門報道,報道指出,Kimi K2在各項基準測試中的表現可與西方競爭對手相媲美,甚至更勝一籌,同時也超越了部分DeepSeek模型。文章認為,Kimi K2是繼1月DeepSeek推出R1震驚世界之后,六個月內中國推出的第二款令人矚目的模型,世界迎來“又一個DeepSeek時刻”。
![]()
而就在Kimi K2發布一周之后,7月18日,國際權威大模型排行榜LMArena揭曉最新排名:北京月之暗面科技有限公司(以下簡稱“月之暗面”)研發的萬億參數開源模型Kimi K2強勢登頂全球開源模型榜首!同時,Kimi K2獲得了超3000張社區投票,在大模型競技場的總榜上排名第五。
![]()
在所有大模型排名中,kimi-k2排名第五,前四模型均為閉源模型
有學者指出,Kimi K2帶來的“DeepSeek時刻”應該引起西方科技圈的再一次重視和覺醒。
![]()
三次考上清華的汕頭90后
痛擊美國AI巨頭
Kimi K2是一款具備更強代碼能力、更擅長通用Agent任務的MoE架構基礎模型,其在SWE Bench Verified(編程)、Tau2(智能體)、AceBench(工具調用)等基準性能測試中,均取得開源模型中的SOTA成績(指在特定任務或基準測試中取得當前最佳表現),展現出在代碼、智能體、數學推理任務上的領先能力。而代碼能力和Agent的自主工具使用能力是此次K2發布的一大重點,同時也是全球大模型廠商正在發生的轉變。
![]()
當用戶將13萬行的原始數據丟給K2,根據實測案例,它可以幫你分析遠程辦公比例對薪資的影響,還自動生成統計圖表與回歸模型解讀,并用統一色調做出相關專業圖表,整理成報告。
據介紹,Kimi K2模型參數總規模達到萬億級別,但激活參數只有32B。這意味著,Kimi K2模型能以更低的成本、開展更加復雜的工作。目前,Kimi K2已接入OpenRouter、Cline、Visual Studio Code等國際主流開發平臺。
Kimi K2由北京月之暗面科技有限公司(Moonshot AI)推出的開源萬億參數大模型,這家成立僅有兩年多時間的企業,卻是很有代表性的一家中國AI創業公司,其創始人楊植麟年僅32歲,在最新的《新財富》雜志500創富榜上,身家已達到93.9億元。
![]()
楊植麟
楊植麟1993年出生于廣東汕頭,2008年,15歲的楊植麟一腳踏入汕頭最好的高中——金山中學。高一時,他加入了學校的信息學奧賽班,僅訓練一年,就在全國青少年信息學奧林匹克聯賽中獲得廣東賽區一等獎,首次獲得清華大學保送資格;緊接著,他又參加了清華大學的自主招生考試,再次超越錄取分數線拿到了錄取資格;高三時,已是清華保送生的他決定以普通高考生的身份參加高考,結果以667的高分考上汕頭市的理科狀元,第三次獲得了清華的錄取資格。
2019年,楊植麟在美國卡內基梅隆大學計算機學院獲博士學位,后來曾在Facebook人工智能研究院和谷歌大腦研究院任職。
![]()
2023年3月,楊植麟在北京創辦月之暗面科技有限公司,同年10月發布大模型 kimi,迅速引發關注。值得一提的是,月之暗面在創業一年之內就已經完成總額超過30億元的融資,其在2024年初獲得當時國內大模型誕生的最大筆融資,被阿里、紅杉等著名資本爭投。
![]()
競爭之下,Kimi需要繼續證明自己
值得注意的是,此次月之暗面是搶在DeepSeek R2之前推出萬億參數大模型,并同樣采取開源策略。這不僅是月之暗面的一次技術發布,更是一場豪賭。
可以看到,經兩年多的狂飆突進,大模型行業正在快速收攏。在海外,大模型決賽圈被收攏至OpenAI、谷歌、Meta、Anthropic和xAI五家公司,各家的發布也呈現你追我趕的態勢。在國內,競爭也從未停止。
今年1月20日,DeepSeek發布R1引爆全網之時,Kimi其實也發布了其多模態推理模型K1.5.雖然和R1一起被OpenAI認證為最早破解o1技術原理的兩個模型之一,但很長一段時間,Kimi都在DeepSeek所占據C位的聚光燈外。
其后,Kimi又與DeepSeek多次在論文和模型上“撞車”。在這種頻繁的追趕和技術交鋒中,不同于DeepSeek背靠母公司幻方量化在算力和資金方面的有力支撐,Kimi除了需要堅持基礎大模型的訓練,還面臨商業化的挑戰,如何與中國的開源模型們一起打破技術壟斷,也是接下來Kimi們需要翻越的大山。
文中所用圖片來源網絡
【編者聲明】
本公眾號部分素材來自網絡,版權歸原作者所有。編者收集整理,旨在與大家分享學習。如您認為某些內容侵犯您的權益,請及時告知,我們核實后將采取相應措施。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.