網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

前端同事看走眼了，這個(gè)“游戲網(wǎng)頁(yè)”其實(shí)全是AI寫的!

2026-01-27 22:37:17　來(lái)源: InfoQ

北京舉報(bào)

分享至

作者｜木子、高允毅

Vibe Coding 的進(jìn)化速度，可能還是超乎了我們的想象。

今天，我們?cè)跍y(cè)試 Kimi K2.5 的網(wǎng)頁(yè)生成功能時(shí)，旁邊的前端開發(fā)同事還以為是真實(shí)的網(wǎng)頁(yè)場(chǎng)景，低聲問(wèn)我：“你這是在寫代碼嗎，還是在摸魚打游戲？”

直到我說(shuō)出這是 AI 生成的，而且是只用了幾句話就做出來(lái)的效果，這讓她大為驚訝。

該網(wǎng)頁(yè)長(zhǎng)這樣，現(xiàn)在如果不明說(shuō)的話，確實(shí)已經(jīng)難辨“真假”。

Kimi K2.5 在今天剛剛上新，它沒有把重點(diǎn)放在“單項(xiàng)能力突破”上，而是試圖把視覺理解、代碼生成、交互設(shè)計(jì)，以及多 Agent 協(xié)作，都?jí)哼M(jìn)了同一個(gè)模型里，一口氣提供了四種使用模式。

在筆者看來(lái)，其中最有意思的，當(dāng)屬Agent 集群模式——這也是在國(guó)內(nèi) AI 上第一次出現(xiàn)的功能，它可以讓原本耗時(shí)數(shù)天的工作，現(xiàn)在僅需十幾分鐘就能做完，簡(jiǎn)直是指數(shù)級(jí)的提效。

比如，要做 100 家公司的市場(chǎng)調(diào)研，它能指揮一群不同行業(yè)背景的“分析師”分頭行動(dòng)，十幾分鐘出結(jié)果，而不是幾個(gè)星期；面對(duì) 300 頁(yè)的復(fù)雜翻譯項(xiàng)目，它能動(dòng)員一個(gè)“語(yǔ)言學(xué)專家”團(tuán)隊(duì)，快速、準(zhǔn)確地完成交付。

四種模式具體如下。不同需求的用戶，從隨手一問(wèn)，到需要并行推進(jìn)的復(fù)雜任務(wù)，都能找到明確的入口：

快速模式，提供最快的響應(yīng)體驗(yàn)。
思考模式，可以用來(lái)解答復(fù)雜問(wèn)題。
Agent 模式，擅長(zhǎng)深度研究、PPT、Excel、Word、PDF 和網(wǎng)頁(yè)生成等任務(wù)——目前 K2.5 已經(jīng)開始掌握 Office 套件的核心技能，其協(xié)助辦公的能力不容小覷。
重磅全新模式：Agent 集群模式，適合需要并行處理的復(fù)雜任務(wù)

另外，新編程產(chǎn)品Kimi Code不僅能直接在終端里運(yùn)行，還能無(wú)縫集成到 VSCode、Cursor、Zed 這些 IDE 里，支持直接輸入圖片和視頻。

月之暗面 CEO 楊植麟，這次親自為新模型發(fā)布錄制了視頻。

1 Kimi K2.5 實(shí)測(cè)

看起來(lái)很強(qiáng)是一回事，那用起來(lái)是不是另一回事？以下是各種實(shí)操案例，InfoQ 也上手測(cè)了幾組。

幾分鐘搓出前端網(wǎng)頁(yè)，動(dòng)效自然，還能有聲音

為了測(cè)試 Kimi K2.5 的視覺理解能力和 Vibe Coding 水平，我們首先直接甩出一張產(chǎn)品頁(yè)面截圖，再配上幾句文字描述，看看它能不能自己看懂、自己理解，順手還能復(fù)刻出一個(gè)像模像樣的產(chǎn)品頁(yè)面。

比如讓K2.5做個(gè)一個(gè)最近很火的心靈療愈類項(xiàng)目，給的Prompt如下：

模仿情緒療愈類產(chǎn)品，生成一個(gè)情緒記錄類APP，適合年輕人釋放情緒，讓人一眼覺這里允許脆弱的地方。可以說(shuō)，這個(gè) Prompt 并不友好：提示不多，要求不少，還同時(shí)考驗(yàn)了它的視覺理解能力、邏輯思維、產(chǎn)品思維以及設(shè)計(jì)審美。

可以說(shuō)，這個(gè)Prompt提示不多，要求不少，對(duì)模型視覺理解能力、邏輯思維、產(chǎn)品思維以及設(shè)計(jì)審美能力都是考驗(yàn)。

從結(jié)果看，K2.5對(duì)“情緒”這個(gè)概念本身是有一定理解和思考的。它生成的是一個(gè)以沉浸體驗(yàn)為核心的情緒頁(yè)面，而不是常規(guī)的情緒記錄工具。

視覺上，明顯沒走淺色卡片流那條老路，而是用了低對(duì)比背景、連續(xù)畫面和節(jié)奏型動(dòng)效（類似呼吸或旋渦），交互重點(diǎn)放在“停留”和“進(jìn)入狀態(tài)”上。

在功能組織上，輸入、反饋和過(guò)渡是連在一起的：用戶不是“點(diǎn)一個(gè)按鈕開始記錄”，而是被自然引導(dǎo)進(jìn)入輸入狀態(tài)——這種設(shè)計(jì)說(shuō)明它在生成時(shí)已經(jīng)考慮了狀態(tài)流轉(zhuǎn)，而不是只輸出一個(gè)靜態(tài)頁(yè)面。

接下來(lái)，我們不再給任何視覺參考，只輸入文字提示，讓 K2.5獨(dú)立完成整個(gè)網(wǎng)頁(yè)設(shè)計(jì)。

我們給的 Prompt 很簡(jiǎn)單：

做一個(gè)類似 4399 的小游戲平臺(tái)，要有完整的游戲分類頻道；但視覺審美要大廠級(jí)、高端網(wǎng)游風(fēng)，整體要酷炫、有沖擊力，并且可交互。

說(shuō)實(shí)話，Kimi K2.5 的輸出結(jié)果確實(shí)有點(diǎn)超乎我們的預(yù)期。

它給出的頁(yè)面，既貼合主題，又有高級(jí)感；模塊分區(qū)賞心悅目，視覺層級(jí)清晰，呈現(xiàn)方式更接近內(nèi)容推薦平臺(tái)，而不是簡(jiǎn)單的列表堆疊——比起幾年前的那些小游戲網(wǎng)頁(yè)可謂降維打擊。

在筆者看來(lái)，就這類前端生成任務(wù)而言，Kimi K2.5 已經(jīng)可以算是站到了 Vibe Coding 第一梯隊(duì)，其審美力和全球大熱的 AI 工具 Lovable 有不少共通之處。

類似的例子還有不少。下面這些網(wǎng)頁(yè)，都是 K2.5 在圖像生成工具的輔助下，僅憑一條 Prompt直接生成的完整原型。

除了做整個(gè)頁(yè)面，我們還單獨(dú)測(cè)評(píng)了一下K2.5 對(duì)動(dòng)效的理解能力。

左側(cè)是我們輸入的一段小視頻，右側(cè)是它生成的效果。結(jié)果 K2.5幾乎是完整復(fù)刻，拖動(dòng)鼠標(biāo)，圖片會(huì)隨之產(chǎn)生位移變化，邏輯和節(jié)奏都對(duì)得上，動(dòng)效也足夠絲滑。

也就是說(shuō)，K2.5 不是在“畫動(dòng)效”，而是真的理解了交互在時(shí)間維度上的設(shè)計(jì)意圖。

這對(duì)開發(fā)和設(shè)計(jì)而言，意味著動(dòng)效不再必須從一堆參數(shù)和曲線開始，而是可以先把想法直接跑成一個(gè)可交互的原型，用幾分鐘看清值不值得投入工程成本。

以前要干好幾天的活，十幾分鐘就能搞定

至于 K2.5 的Agent 集群模式，最直觀的能力就是：把時(shí)間尺度直接拉短了。過(guò)去需要“按天算”的復(fù)雜任務(wù)，現(xiàn)在往往十幾分鐘就能跑完一整輪。

來(lái)看一個(gè)實(shí)測(cè)例子。

一次性向 Kimi 的 Agent 集群投喂了40 篇論文，主題橫跨心理學(xué)與 AI。任務(wù)是，在此基礎(chǔ)上產(chǎn)出一份系統(tǒng)性的研究綜述。

Kimi 的處理流程大致分成了三步：第一步，完整通讀。主 agent 多次調(diào)用工具，按順序把 40 篇論文逐篇過(guò)了一遍，確保所有關(guān)鍵信息都被納入同一上下文，而不是零散記憶。

第二步，并行寫作。在理解整體結(jié)構(gòu)后，Kimi 自動(dòng)派生出多個(gè)子 agent——可以理解為它的“分身”，分別負(fù)責(zé)不同章節(jié)的撰寫，各自并行推進(jìn)。

第三步，統(tǒng)一收斂。主 agent 最后回到臺(tái)前，負(fù)責(zé)校對(duì)、取舍和整合，把各個(gè)子 agent 的成果匯總成一份長(zhǎng)達(dá)幾十頁(yè)的專業(yè) PDF 級(jí)綜述。

整個(gè)過(guò)程里中，幾乎看不到人工干預(yù)。

2 當(dāng)Transformer開始吃力，K3可能用上原創(chuàng)架構(gòu)KDA

我們先后測(cè)評(píng)了一整天，總體感受很明確：

Kimi K2.5 在自己擅長(zhǎng)的多個(gè)方向上，已經(jīng)跑得相當(dāng)順了。比如網(wǎng)頁(yè)設(shè)計(jì)生成、動(dòng)效理解、多Agent 協(xié)作等場(chǎng)景，完成度和穩(wěn)定性都比較成熟。不過(guò)也有短板，比如在 3D 建模這類強(qiáng)幾何約束的任務(wù)上，表現(xiàn)還欠佳。

當(dāng)這些能力被一項(xiàng)項(xiàng)跑出來(lái)之后，更現(xiàn)實(shí)的問(wèn)題也浮現(xiàn)出來(lái)：如果這些復(fù)雜推理真的要被當(dāng)成日常能力反復(fù)調(diào)用，底層的計(jì)算方式還能不能長(zhǎng)期扛得住？

月之暗面給出的一個(gè)解法，是Kimi Linear，而Kimi Linear中的一個(gè)核心創(chuàng)新點(diǎn)，是一個(gè)新的實(shí)驗(yàn)性架構(gòu)：KDA（Kimi Delta Attention），一種線性注意力模塊的相關(guān)思路。

楊植麟此前在Reddit上的AMA（Ask Me Anything）等公開交流中已經(jīng)透露，下一代K3模型，可能會(huì)使用月之暗面的這個(gè)新架構(gòu)KDA。

要講清楚KDA的優(yōu)勢(shì)，我們還得先從Transformer架構(gòu)說(shuō)起。

本質(zhì)上，Transformer的注意力機(jī)制是全連接的：每個(gè) token 都要和上下文里的其他 token 打一次交道。結(jié)果，輸入一長(zhǎng)，計(jì)算量就按平方增長(zhǎng)（O(N2)）；生成新 token 時(shí)，還要不斷回查之前的 KV Cache。

當(dāng)上下文一拉長(zhǎng)，顯存壓力迅速飆升，尤其是在 128K以上的場(chǎng)景里，幾乎是“顯卡先崩，錢包隨后”。

——而且模型越強(qiáng)，這個(gè)問(wèn)題就越明顯。

也正因?yàn)槿绱耍^(guò)去幾年里，線性注意力一直是業(yè)內(nèi)反復(fù)被拿出來(lái)討論的一條路：把注意力計(jì)算從 O(N2) 壓到 O(N)，讓模型跑得更快、也更省。

但現(xiàn)實(shí)是，早期不少線性注意力方案確實(shí)快了，卻很難兼顧記憶能力：信息留不住，推理質(zhì)量也跟著打折。

而KDA的核心思想可以概括為一句話：不再每次都“全量算一遍注意力”，而是每次只計(jì)算“狀態(tài) + 增量（Delta）更新”。

這里的Delta（增量）是關(guān)鍵。

在保持模型能力的同時(shí)，顯著降低長(zhǎng)上下文和連續(xù)推理的計(jì)算成本——思路有點(diǎn)像 MoE 架構(gòu)。

3 One more thing

在測(cè)試 Kimi K2.5 的視覺理解能力時(shí)，我們索性出了一道“狠題”。

——甩過(guò)去一段動(dòng)畫，讓它先吃透畫風(fēng)和敘事方式，再換個(gè)主題，重寫一支動(dòng)畫腳本。說(shuō)實(shí)話，這活兒對(duì)專業(yè)動(dòng)畫師來(lái)說(shuō)都不輕松，我們還特意把 “Agent 集群”模式打開了。

結(jié)果最有意思的不是生成內(nèi)容本身，而是頁(yè)面最底下那行小字：

“這個(gè)任務(wù) Kimi 自己就能完成，不需要 Agent 集群。部分額度已退回。”

體驗(yàn)傳送門：

https://www.kimi.com/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.