網易首頁 > 網易號 > 正文申請入駐

Kimi k2.5突然發布！「看」圖更卷了，還有個大招能和DeepSeek爭奪開源王者

2026-01-27 15:01:32　來源: AppSo

廣東舉報

分享至

就在剛剛，月之暗面正式發布并開源了 Kimi k2.5。

官方技術報告的第一句話就不裝了：the most powerful open-source model to date——迄今為止最強大的開源模型。

與上一代模型不同，Kimi k2.5 并非簡單的「升級版」，而是一個基于 1.5T 混合視覺與文本 Token 預訓練的原生多模態模型。在這個基礎底座之上，Kimi 團隊構建了一套名為 Visual Agentic Intelligence（視覺智能體智能）的系統。

這意味著，Kimi k2.5 原來已經極其強大的長文本，再次進化成了一個既有「眼睛」能看懂復雜屏幕，又有「雙手」能指揮龐大智能體集群的超級工頭。在 SWE-Bench Verified（編程）和 HLE（人類最后考試）等硬核基準測試中，它不僅超越了 DeepSeek V3，甚至在多項指標上擊敗了閉源的 GPT 和 Gemini。

從「單兵作戰」到「集群思維」

這次發布的更新當中，Agent 集群堪稱是 Kimi k2.5 最亮眼的設計。

在過去的幾年里，無論模型多強，面對超長、超復雜的任務（比如「幫我調研 100 家競品的定價策略」），它們通常只能串行處理：查完第 1 家，再查第 2 家……一旦中間出錯，整個任務鏈就容易斷裂。

Kimi k2.5 引入了 Agent Swarm（智能體集群）架構，其核心理念是 Scaling Out， Not Just Up ——不僅要做大，更要做多。在 Swarm 模式下，Kimi k2.5 會自動扮演指揮官的角色。當接到一個復雜任務時，它不會自己悶頭干，而是瞬間動態創建并指揮多達 100 個智能體的「工頭」。

這些智能體可以是「AI 搜索員」、「AI 物理學家」、「AI 事實核查員」……它們在指揮官的調度下并行工作。技術文檔顯示，Kimi k2.5 支持高達 1500 次并行工具調用（Parallel Tool Calls）。

效果是立竿見影的。在官方演示的「尋找 100 個細分領域的 YouTube 頭部博主」任務中，人類需要幾天，傳統單體 AI 需要數小時，而 Kimi Agent Swarm 僅需幾分鐘。

數據顯示，相比傳統模式，Swarm 架構將端到端任務的執行時間減少了 80%，整體效率提升了 4.5 倍。

為了駕馭這種瘋狂的并發能力，Kimi 團隊采用了一種名為 PARL (Parallel-Agent Reinforcement Learning) 的訓練方法。這讓模型學會了在沒有預定義工作流（Workflow）的情況下，自主拆解任務、分發任務、并處理并行反饋。即便某個子智能體失敗了（Serial Collapse），指揮官也能迅速感知并重新調度。

VLM 過時了，Kimi 帶來「視覺工程師」

如果說 Swarm 是 Kimi 的「大腦」，那么 Visual Coding（視覺編程）就是它進化的「眼睛」。

K2.5 模型支持從簡單的自然語言對話生成完整的前端界面，并能有效處理交互式布局及滾動觸發等動態效果。在 Kimi k2.5 之前，市面上的 VLM（視覺語言模型）大多停留在「看圖說話」的階段——你給它一張網頁截圖，它告訴你「這里有個紅色按鈕」。但如果你讓它寫代碼復刻這個網頁，它往往只能寫出一個死板的 HTML 骨架，根本不懂交互邏輯。

Kimi k2.5 在這里實現了對傳統 VLM 的降維打擊。在下面的例子中，展示的是從視頻復刻網站（Reconstructing a website from video）的操作，左邊為原視頻，右邊為 Kimi 復刻的網站。

你只需要錄制一段網頁操作的視頻投喂給 Kimi k2.5，它不僅能看懂靜態的 UI 布局，還能理解動態的交互邏輯——比如滾動觸發特效、復雜的卡片翻轉動畫等。然后，它會直接生成包含完整 CSS 和 JS 邏輯的可用代碼。

更驚人的是它做視覺調試（Visual Debugging）能力。寫完代碼后，Kimi k2.5 會「看」一眼渲染出來的頁面。如果發現「按鈕歪了」或者「顏色和原視頻不一致」，它會像人類工程師一樣，基于視覺反饋去修改代碼，而不是盲目地重新生成。

這種「觀察-編碼-驗證-修正」的閉環能力，讓 Kimi k2.5 成為了目前開源界當之無愧的新王，代碼和視覺兩手抓。

在權威的 SWE-Bench Verified 測試中，Kimi k2.5 拿下了 76.8 的高分，這一成績不僅碾壓了 GPT 5.2，也超過了同為開源頂流的 DeepSeek V3.2。

當所有人都試圖把單一模型做得越來越大時，Kimi 展示了另一種可能：通過極致的視覺感知理解世界，通過龐大的智能體集群改造世界。

目前，Kimi k2.5 已在 Hugging Face 開源，同時 Agent Swarm 模式也已在 Kimi.com 上線。無論是用戶還是開發者而言，這可能是 2026 年最值得上手一試的開源模型。

歡迎加入 APPSO AI 社群，一起暢聊 AI 產品，獲取，解鎖更多 AI 新知

我們正在招募伙伴

簡歷投遞郵箱 hr@ifanr.com

?? 郵件標題 「姓名+崗位名稱」（請隨簡歷附上項目/作品或相關鏈接）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.