
作者| 木子、高允毅
Vibe Coding 的進(jìn)化速度,可能還是超乎了我們的想象。
今天,我們?cè)跍y(cè)試 Kimi K2.5 的網(wǎng)頁(yè)生成功能時(shí),旁邊的前端開發(fā)同事還以為是真實(shí)的網(wǎng)頁(yè)場(chǎng)景,低聲問(wèn)我:“你這是在寫代碼嗎,還是在摸魚打游戲?”
直到我說(shuō)出這是 AI 生成的,而且是只用了幾句話就做出來(lái)的效果,這讓她大為驚訝。
該網(wǎng)頁(yè)長(zhǎng)這樣,現(xiàn)在如果不明說(shuō)的話,確實(shí)已經(jīng)難辨“真假”。
Kimi K2.5 在今天剛剛上新,它沒有把重點(diǎn)放在“單項(xiàng)能力突破”上,而是試圖把視覺理解、代碼生成、交互設(shè)計(jì),以及多 Agent 協(xié)作,都?jí)哼M(jìn)了同一個(gè)模型里,一口氣提供了四種使用模式。
在筆者看來(lái),其中最有意思的,當(dāng)屬Agent 集群模式——這也是在國(guó)內(nèi) AI 上第一次出現(xiàn)的功能,它可以讓原本耗時(shí)數(shù)天的工作,現(xiàn)在僅需十幾分鐘就能做完,簡(jiǎn)直是指數(shù)級(jí)的提效。
比如,要做 100 家公司的市場(chǎng)調(diào)研,它能指揮一群不同行業(yè)背景的“分析師”分頭行動(dòng),十幾分鐘出結(jié)果,而不是幾個(gè)星期;面對(duì) 300 頁(yè)的復(fù)雜翻譯項(xiàng)目,它能動(dòng)員一個(gè)“語(yǔ)言學(xué)專家”團(tuán)隊(duì),快速、準(zhǔn)確地完成交付。
四種模式具體如下。不同需求的用戶,從隨手一問(wèn),到需要并行推進(jìn)的復(fù)雜任務(wù),都能找到明確的入口:
快速模式,提供最快的響應(yīng)體驗(yàn)。
思考模式,可以用來(lái)解答復(fù)雜問(wèn)題。
Agent 模式,擅長(zhǎng)深度研究、PPT、Excel、Word、PDF 和網(wǎng)頁(yè)生成等任務(wù)——目前 K2.5 已經(jīng)開始掌握 Office 套件的核心技能,其協(xié)助辦公的能力不容小覷。
重磅全新模式:Agent 集群模式,適合需要并行處理的復(fù)雜任務(wù)
![]()
另外,新編程產(chǎn)品Kimi Code不僅能直接在終端里運(yùn)行,還能無(wú)縫集成到 VSCode、Cursor、Zed 這些 IDE 里,支持直接輸入圖片和視頻。
月之暗面 CEO 楊植麟,這次親自為新模型發(fā)布錄制了視頻。
1 Kimi K2.5 實(shí)測(cè)
看起來(lái)很強(qiáng)是一回事,那用起來(lái)是不是另一回事?以下是各種實(shí)操案例,InfoQ 也上手測(cè)了幾組。
幾分鐘搓出前端網(wǎng)頁(yè),動(dòng)效自然,還能有聲音
為了測(cè)試 Kimi K2.5 的視覺理解能力和 Vibe Coding 水平,我們首先直接甩出一張產(chǎn)品頁(yè)面截圖,再配上幾句文字描述,看看它能不能自己看懂、自己理解,順手還能復(fù)刻出一個(gè)像模像樣的產(chǎn)品頁(yè)面。
比如讓K2.5做個(gè)一個(gè)最近很火的心靈療愈類項(xiàng)目,給的Prompt如下:
模仿情緒療愈類產(chǎn)品,生成一個(gè)情緒記錄類APP,適合年輕人釋放情緒,讓人一眼覺這里允許脆弱的地方。可以說(shuō),這個(gè) Prompt 并不友好:提示不多,要求不少,還同時(shí)考驗(yàn)了它的視覺理解能力、邏輯思維、產(chǎn)品思維以及設(shè)計(jì)審美。
可以說(shuō),這個(gè)Prompt提示不多,要求不少,對(duì)模型視覺理解能力、邏輯思維、產(chǎn)品思維以及設(shè)計(jì)審美能力都是考驗(yàn)。
從結(jié)果看,K2.5對(duì)“情緒”這個(gè)概念本身是有一定理解和思考的。它生成的是一個(gè)以沉浸體驗(yàn)為核心的情緒頁(yè)面,而不是常規(guī)的情緒記錄工具。
視覺上,明顯沒走淺色卡片流那條老路,而是用了低對(duì)比背景、連續(xù)畫面和節(jié)奏型動(dòng)效(類似呼吸或旋渦),交互重點(diǎn)放在“停留”和“進(jìn)入狀態(tài)”上。
在功能組織上,輸入、反饋和過(guò)渡是連在一起的:用戶不是“點(diǎn)一個(gè)按鈕開始記錄”,而是被自然引導(dǎo)進(jìn)入輸入狀態(tài)——這種設(shè)計(jì)說(shuō)明它在生成時(shí)已經(jīng)考慮了狀態(tài)流轉(zhuǎn),而不是只輸出一個(gè)靜態(tài)頁(yè)面。
接下來(lái),我們不再給任何視覺參考,只輸入文字提示,讓 K2.5獨(dú)立完成整個(gè)網(wǎng)頁(yè)設(shè)計(jì)。
我們給的 Prompt 很簡(jiǎn)單:
做一個(gè)類似 4399 的小游戲平臺(tái),要有完整的游戲分類頻道;但視覺審美要大廠級(jí)、高端網(wǎng)游風(fēng),整體要酷炫、有沖擊力,并且可交互。
說(shuō)實(shí)話,Kimi K2.5 的輸出結(jié)果確實(shí)有點(diǎn)超乎我們的預(yù)期。
它給出的頁(yè)面,既貼合主題,又有高級(jí)感;模塊分區(qū)賞心悅目,視覺層級(jí)清晰,呈現(xiàn)方式更接近內(nèi)容推薦平臺(tái),而不是簡(jiǎn)單的列表堆疊——比起幾年前的那些小游戲網(wǎng)頁(yè)可謂降維打擊。
在筆者看來(lái),就這類前端生成任務(wù)而言,Kimi K2.5 已經(jīng)可以算是站到了 Vibe Coding 第一梯隊(duì),其審美力和全球大熱的 AI 工具 Lovable 有不少共通之處。
類似的例子還有不少。下面這些網(wǎng)頁(yè),都是 K2.5 在圖像生成工具的輔助下,僅憑一條 Prompt直接生成的完整原型。
除了做整個(gè)頁(yè)面,我們還單獨(dú)測(cè)評(píng)了一下K2.5 對(duì)動(dòng)效的理解能力。
左側(cè)是我們輸入的一段小視頻,右側(cè)是它生成的效果。結(jié)果 K2.5幾乎是完整復(fù)刻,拖動(dòng)鼠標(biāo),圖片會(huì)隨之產(chǎn)生位移變化,邏輯和節(jié)奏都對(duì)得上,動(dòng)效也足夠絲滑。

也就是說(shuō),K2.5 不是在“畫動(dòng)效”,而是真的理解了交互在時(shí)間維度上的設(shè)計(jì)意圖。
這對(duì)開發(fā)和設(shè)計(jì)而言,意味著動(dòng)效不再必須從一堆參數(shù)和曲線開始,而是可以先把想法直接跑成一個(gè)可交互的原型,用幾分鐘看清值不值得投入工程成本。
以前要干好幾天的活,十幾分鐘就能搞定
至于 K2.5 的Agent 集群模式,最直觀的能力就是:把時(shí)間尺度直接拉短了。過(guò)去需要“按天算”的復(fù)雜任務(wù),現(xiàn)在往往 十幾分鐘就能跑完一整輪。
來(lái)看一個(gè)實(shí)測(cè)例子。
一次性向 Kimi 的 Agent 集群投喂了40 篇論文,主題橫跨心理學(xué)與 AI。任務(wù)是,在此基礎(chǔ)上產(chǎn)出一份系統(tǒng)性的研究綜述。
Kimi 的處理流程大致分成了三步:第一步,完整通讀。主 agent 多次調(diào)用工具,按順序把 40 篇論文逐篇過(guò)了一遍,確保所有關(guān)鍵信息都被納入同一上下文,而不是零散記憶。
第二步,并行寫作。在理解整體結(jié)構(gòu)后,Kimi 自動(dòng)派生出多個(gè)子 agent——可以理解為它的“分身”,分別負(fù)責(zé)不同章節(jié)的撰寫,各自并行推進(jìn)。
第三步,統(tǒng)一收斂。主 agent 最后回到臺(tái)前,負(fù)責(zé)校對(duì)、取舍和整合,把各個(gè)子 agent 的成果匯總成一份長(zhǎng)達(dá)幾十頁(yè)的專業(yè) PDF 級(jí)綜述。
整個(gè)過(guò)程里中,幾乎看不到人工干預(yù)。
2 當(dāng)Transformer開始吃力,K3可能用上原創(chuàng)架構(gòu)KDA
我們先后測(cè)評(píng)了一整天,總體感受很明確:
Kimi K2.5 在自己擅長(zhǎng)的多個(gè)方向上,已經(jīng)跑得相當(dāng)順了。比如網(wǎng)頁(yè)設(shè)計(jì)生成、動(dòng)效理解、多Agent 協(xié)作等場(chǎng)景,完成度和穩(wěn)定性都比較成熟。不過(guò)也有短板,比如在 3D 建模這類強(qiáng)幾何約束的任務(wù)上,表現(xiàn)還欠佳。
當(dāng)這些能力被一項(xiàng)項(xiàng)跑出來(lái)之后,更現(xiàn)實(shí)的問(wèn)題也浮現(xiàn)出來(lái):如果這些復(fù)雜推理真的要被當(dāng)成日常能力反復(fù)調(diào)用,底層的計(jì)算方式還能不能長(zhǎng)期扛得住?
月之暗面給出的一個(gè)解法,是Kimi Linear,而Kimi Linear中的一個(gè)核心創(chuàng)新點(diǎn),是一個(gè)新的實(shí)驗(yàn)性架構(gòu):KDA(Kimi Delta Attention),一種線性注意力模塊的相關(guān)思路。
楊植麟此前在Reddit上的AMA(Ask Me Anything)等公開交流中已經(jīng)透露,下一代K3模型,可能會(huì)使用月之暗面的這個(gè)新架構(gòu)KDA。
![]()
要講清楚KDA的優(yōu)勢(shì),我們還得先從Transformer架構(gòu)說(shuō)起。
本質(zhì)上,Transformer的注意力機(jī)制是全連接的:每個(gè) token 都要和上下文里的其他 token 打一次交道。結(jié)果,輸入一長(zhǎng),計(jì)算量就按平方增長(zhǎng)(O(N2));生成新 token 時(shí),還要不斷回查之前的 KV Cache。
當(dāng)上下文一拉長(zhǎng),顯存壓力迅速飆升,尤其是在 128K以上的場(chǎng)景里,幾乎是“顯卡先崩,錢包隨后”。
——而且模型越強(qiáng),這個(gè)問(wèn)題就越明顯。
也正因?yàn)槿绱耍^(guò)去幾年里,線性注意力一直是業(yè)內(nèi)反復(fù)被拿出來(lái)討論的一條路:把注意力計(jì)算從 O(N2) 壓到 O(N),讓模型跑得更快、也更省。
但現(xiàn)實(shí)是,早期不少線性注意力方案確實(shí)快了,卻很難兼顧記憶能力:信息留不住,推理質(zhì)量也跟著打折。
而KDA的核心思想可以概括為一句話:不再每次都“全量算一遍注意力”,而是每次只計(jì)算“狀態(tài) + 增量(Delta)更新”。
這里的Delta(增量)是關(guān)鍵。
在保持模型能力的同時(shí),顯著降低長(zhǎng)上下文和連續(xù)推理的計(jì)算成本——思路有點(diǎn)像 MoE 架構(gòu)。
3 One more thing
在測(cè)試 Kimi K2.5 的視覺理解能力時(shí),我們索性出了一道“狠題”。
——甩過(guò)去一段動(dòng)畫,讓它先吃透畫風(fēng)和敘事方式,再換個(gè)主題,重寫一支動(dòng)畫腳本。說(shuō)實(shí)話,這活兒對(duì)專業(yè)動(dòng)畫師來(lái)說(shuō)都不輕松,我們還特意把 “Agent 集群”模式打開了。
結(jié)果最有意思的不是生成內(nèi)容本身,而是頁(yè)面最底下那行小字:
“這個(gè)任務(wù) Kimi 自己就能完成,不需要 Agent 集群。部分額度已退回。”
![]()
體驗(yàn)傳送門:
https://www.kimi.com/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.