大家好,我是冷逸。
在Gemini 3發(fā)布后,我很早就說過,我們急需要一個。
現(xiàn)在,似乎有答案了。剛剛,Kimi發(fā)布并開源了全新的基座模型K2.5,文字/圖片/視頻理解能力Max。
![]()
K2.5模型在huggingface上開源
感覺Kimi這次,是帶著大殺器傾巢而來。
我趕緊體驗了一番,先說結(jié)論:這可能是目前最強(qiáng)的開源視覺Agentic模型。特別是前端方面,直追Gemini 3 Pro。
![]()
快速了解K2.5
簡單介紹一下這個模型。
K2.5最大的特點(diǎn)是全能:
原生的多模態(tài)架構(gòu):天生具備視覺能力,理解圖片、視頻就像讀文字一樣自然。
超全的能力&性價比:K2.5同步提供快速版、思考版、Agent版和Agent集群。
基于K2.5,Kimi帶來了全新的體驗:
![]()
1)超級視覺
不僅能看,更能推理,具備Visual Reasoning和Agentic Tool Call。
256k上下文,能吃得下2小時長視頻 /100MB文件,支持視覺版“大海撈針”。
2)Visual Coding
支持Image/Video to Code,所見即所得。
上傳一張圖片或視頻(<100MB),Kimi能秒懂你的意圖,像素級復(fù)刻一個網(wǎng)頁。
比如,復(fù)刻一個交互超級牛逼的網(wǎng)站。
![]()
3)Agent Swarm
Agent集群,能同時調(diào)度多個Agent協(xié)作,可一口氣獨(dú)立完成1500+步驟。
比如,幫我們一次性調(diào)研100家上市公司,一次下載100篇學(xué)術(shù)論文,生成100張素材圖。
4)Office Agent
Office三件套全新升級,可以幫助用戶直接交付準(zhǔn)專業(yè)水平的辦公文檔。
![]()
5)Kimi Code
以上所有功能,現(xiàn)在已可以在kimi.com直接體驗。
同步,Kimi還推出了全新的編程工具:Kimi Code。
Kimi Code不僅能在終端里直接運(yùn)行,也能無縫集成到VSCode、Cursor、JetBrains和Zed等主流編輯器中。
![]()
體驗地址:www.kimi.com/code
![]()
一手實(shí)測
K2.5上線后,我也趕緊體驗了一番。
1)前端復(fù)刻
之前,Gemini 3 Pro的前端復(fù)刻,被很多人玩壞了。
我用K2.5,也來試一下。
給《流浪地球》的行星發(fā)動機(jī)做一個動畫演示網(wǎng)頁。
![]()
參考這張圖片設(shè)計一個教學(xué)演示網(wǎng)頁。
復(fù)刻這個網(wǎng)頁,讓眼珠子跟著鼠標(biāo)移動。
![]()
復(fù)刻OpenAI News。
![]()
復(fù)刻Moonshot官網(wǎng)。
![]()
更有意思的是,K2.5支持視頻復(fù)刻。可以把你喜歡的APP錄屏,然后發(fā)給K2.5,讓它設(shè)計一個類似的產(chǎn)品。
![]()
體驗下來,前端這塊,我覺得K2.5和Gemini 3 Pro已經(jīng)沒什么區(qū)別了。頂級審美,頂級動效,以及頂級的視覺理解能力。
2)網(wǎng)站開發(fā)
體驗完前端,我們來讓它做一個真正的網(wǎng)站。
上周,北京不是下雪了,我找了一張故宮雪景的圖片,打開K2.5 Agent模式,讓它幫我設(shè)計一個網(wǎng)站。
![]()
![]()
它會自己理解這張圖的美學(xué)意境,包括設(shè)計元素、視覺效果等。
![]()
然后,調(diào)用Agent給我們進(jìn)行開發(fā),并部署上線。
![]()
給大家看下最終的成品(一次輸出,沒有抽卡)。
特別是1-3屏,這排版、布局和交互真的太棒了,這就是我們的東方美學(xué)。
![]()
讓它復(fù)刻網(wǎng)站wodniack.dev,完成效果非常nice,超級酷炫。
![]()
也可以做漢堡的分層拆解動畫。
![]()
3)批量work
如果說前面的體驗,大家覺得“嗯,好像還不錯”。
那Agent Swarm(Agent集群),相信我,你一定會被這個功能給驚訝到的。
![]()
體驗地址:https://www.kimi.com/agent-swarm
最近,不是全民都在學(xué)Skills嘛,那我想讓「Agent集群」幫我整理50個高Star的Skills,于是就問它:
幫我從GitHub上搜集50個熱門的Claude Code Skills,按照Star數(shù)從高到低排列。
初次體驗,會提示消耗3次Agent額度。想象這個工程量,只消耗3次額度似乎還是很劃算的,讓它繼續(xù)干吧。
![]()
然后,它就招來了3個助手幫我干活。每個助手的工作內(nèi)容,各不相同。
![]()
活干到一半,只收集到39個skills,還沒完成。kimi又繼續(xù)拉了小北、海明威兩位替補(bǔ)助手,繼續(xù)給我干活。
![]()
最終,集齊了50個skills,一次性給到了我。
![]()
不得不說,這個“批量work”的效果太贊了,就是速度有點(diǎn)慢(大部分時間因為耗在GitHub訪問失敗的地方)。
不過沒關(guān)系,它是在K2.5 Agent自己的后臺運(yùn)行。在Agent工作期間,我完全可以去做其他事情,等有結(jié)果了再來驗收。
所以,我又用它跑了一些其他的case。
比如,我讓它用我頭像做一系列連續(xù)性的打斗動畫。
![]()
![]()
批量下載論文。
![]()
![]()
召集專家建言獻(xiàn)策,如何讓1歲孩子上北大。
![]()
以及,批量生圖。
![]()
不得不說,Kimi這次是真的把并發(fā)拉滿了。
從K1.5卷長度,到K2卷深度思考,再到今天K2.5卷并發(fā)。每次新模型的發(fā)布,Kimi都總能給我們新的答案,而且一次比一次猛。
并發(fā)拉滿,考驗的不只是模型本身,而是工程、調(diào)度、成本、穩(wěn)定性的一整套系統(tǒng)能力。
這次Kimi能夠把這個產(chǎn)品做出來,是真的。
4)視覺理解與推理
最后,我們考驗一下模型基本的視覺理解和推理能力。
隨手拍了張照片(圖中大樓標(biāo)志已被抹除),問問它這是哪里。
![]()
沒錯,這里是北京的京東科技大廈,Kimi正是在這里辦公。
又問了一張圖,這是什么雪山,推測一下我拍攝時的海拔高度。
![]()
非常準(zhǔn)確,玉龍雪山,海拔9,000-11,000米。
接著,我又問了一個問題。
![]()
其實(shí),一開始我都不抱希望。
![]()
但是看到結(jié)果,有點(diǎn)被驚訝到了。除了航線外(實(shí)際為“四川成都-云南芒市”),它差一點(diǎn)就全部推理出了。
給大家看下真實(shí)的Exif信息。
![]()
K2.5也能做這樣的行測題,反正我是看不懂。
![]()
實(shí)測下來,像推理地理位置、樓層高度、人物身高、作品名稱這些,K2.5基本能猜個八九不離十,當(dāng)然還做不到100%的準(zhǔn)確。
但如果拿來分析一些股票圖、科研圖、行測題、Puzzle題、幾何題等,基本都能得到靠譜的答案,準(zhǔn)確率很高。
![]()
所以,整個體驗下來,才會有了開篇那句話“感覺Kimi這次是帶著大殺器傾巢而來。”
K2.5快速、K2.5思考、K2.5 Agent、K2.5 Agent集群,以及新上線的office三件套、Kimi Code,量大管飽,應(yīng)有盡有。
![]()
這種“傾巢而來”并非雜亂無章的堆料,而是生態(tài)級的All IN,且誠意滿滿。
快速版負(fù)責(zé)效率(日常夠用),思考版兜底復(fù)雜問題,Agent負(fù)責(zé)把模型能力變成生產(chǎn)力,Agent集群則專門解決規(guī)模化問題……
很高興,今天終于能夠有國產(chǎn)模型在多模態(tài)理解和Coding能力上追平海外頂尖模型。
而且還是開源的。
正是,潮平兩岸闊,風(fēng)正一帆懸。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.