大家好,我是冷逸。最近,中國模型殺瘋了,我也快忙瘋了。
進入2026年,感覺我每天16個小時都泡在AI里,也追不上AI進化的速度。每天一睜眼,世界就變了樣。
就這幾天,Seedance 2.0以極強的導演級AI能力登頂視頻王座。就在昨晚,悄悄上線了最新模型。而就在剛剛,智譜AI也發布了全新的基座模型GLM-5。
這是它的bench得分。與自己的GLM-4.7比,大幅提升;與御三家相比,也互有勝負。
![]()
真的,麻了。
大家都在快快快快快,我也跟著追追追追追。
好好好,既然都在一個時間上線,那我就一起做期橫評吧。
![]()
橫評GLM-5與DeepSeek
DeepSeek新模型,測試渠道是在DeepSeek官網(已確認使用的是最新版)。
![]()
GLM-5是在Z.ai測試,主要是Chat模式。
![]()
1)推理:經典洗車難題
先來一道最近熱門的「洗車難題」,據說把ChatGPT、Claude、Gork、豆包、千問、元寶都給干趴下了。
我想去洗車,洗車店距離我家50米,你說我應該開車過去還是走過去?
都開啟Thinking模式,DeepSeek直接明了:開過去。
![]()
GLM-5也是建議開過去。
![]()
同時,它還給了2種最佳操作方案。如果店里是人工精洗,那就把鑰匙給店員,自己回家休息。如果是機洗,建議洗完再兜個圈,讓車身上的風把水吹干。
![]()
你別說,GLM-5這還考慮得挺全面的。
但如果不開Thinking模式,我發覺他倆就大相徑庭了。GLM仍是讓開過去,畢竟洗的是車。DeepSeek則說走過去,因為“50米開車屬于‘無效磨損’”……
![]()
![]()
確實,非Thinking模式下,DS容易出錯。
2)前端:信息圖
日常發文章,我會經常用到一張信息圖,多數情況我都是用Gemini 3 Pro生成。
提示詞是:
提煉下面內容的核心關鍵點,創建一個HTML網頁。
文字內容:
{
你的內容
}
網頁的設計要求如下:
1.視覺設計:采用{Magazine Layout}風格布局,{深色}主題色,營造現代高端氛圍。
2.字體與排版:
·使用超大字體或數字突出核心要點,中文采用大號粗體,強調視覺沖擊力。
·英文使用小號字體作為點綴,與中文形成比例反差,提升設計層次感。
3視覺元素:
·融入超大視覺元素(如標題、背景圖或裝飾)以突出重點,與小型元素形成強烈對比。
·使用簡潔的勾線風格圖形作為數據可視化或配圖元素,保持現代感和清晰度。
4.色彩與效果:運用高亮色(單色透明度漸變)營造科技感,每種高亮色獨立使用,避免不同高亮色之間的漸變混雜。
5.技術要求:引入專業圖標庫(如Font Awesome或Material Icons,通過CDN加載),避免使用emoji作為主要圖標。
6.內容要求:提煉內容關鍵要點,不忽略重要細節。我整理了GLM-5的一些資料,讓DeepSeek和GLM-5都生成一下。
先看DeepSeek的。
![]()
整體版式ok,數字和關鍵詞的視覺張力也都有,色彩也是AI常見的青、藍、紫色。但簡潔線條有點過于豐富了,再加上過多的圖標,反而不太好看。
再來看下GLM-5的。
![]()
倒是簡單明了,層次分明,小字、大字和數字錯位排版。用的圓角UI,比DeepSeek也入眼了一些。如果是網頁瀏覽,還有懸停動畫和光暈視差。
順手,我還用Gemini 3 Pro生成了下。
![]()
單這個信息圖Case來說,我感覺GLM-5和Gemini 3不相上下。
3)前端:設計完整網站
前幾天,我給大家介紹了一個有意思的產品:。
很多人想體驗,但我發現他們沒有官方網站。現在,我讓DeepSeek和GLM-5分別搓一個。
提示詞很簡單,我都懶得描述,直接讓AI讀我的文章來設計網站。
給這篇文章的產品寫一個宣傳網頁: https://mp.weixin.qq.com/s/KM0youAHaJLq45UO3v-L5w
先看GLM-5的。
第一次打開網站,說實話,我有點被驚到了。它在首頁做了一個模擬抖音的故障藝術效果,紫色主色調+青粉色的霓虹點綴耐看,也符合產品的調性。

核心板塊,Hero、功能、案例、創作以及下載指引,該有的都有。而且,GLM對Logo的提煉非常精準,實際上我并沒有告訴他它。
整體看下來,我覺得這就是我想要的產品官網。Loopit的朋友,可以私聊我要源碼了。
然后,我們來看看DeepSeek交的。
還蠻好玩的,用鼠標點一下就會隨機出現一些字或者圖標,確實魔性。
但我覺得它不是產品官網,如果我要真的上架,要改動的地方還不少。不知道大家怎么看這組對比,歡迎評論區告訴我。
4)3D:魔方模擬器
這是x上(@Ryan Lazuka)的一個提示詞。
提示詞:Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself.
中文:創建一個HTML文件,其中使用Three.js(通過CDN方式引入)來實現一個功能完備的3D魔方模擬程序。該魔方必須能夠自動完成自己的“解謎”過程。要能夠記住魔方的打亂步驟,并反向求解,這特別考驗模型的推理和計算能力。
先看下DeepSeek的,它就自己一個人在那玩(演示),完全不讓用戶玩,大概率是生成失敗了。

再來看下GLM-5的,基本還原出來了。在隨機打亂后,魔方能自動逆向還原,不會出錯。

歡迎大家體驗:https://chat.z.ai/space/z1y9j1cck7p0-art
總結一下:在前端這塊,從審美到3D,到計算能力,我認為GLM-5的表現都要優于DeepSeek新模型,甚至能夠與Gemini 3 Pro扳手腕。
當然,DeepSeek本身也不差,而且在“架構瘦身”和“智商擴容”上有很多創新。而他倆都開源,都Media in China。
也難怪,最近x上有很多老外在瘋狂求魔法,求手機賬號,來體驗我們中國的模型。
![]()
Agentic測試:一鍵做視頻
但如果只是測前端、One Shot的話,我覺得把GLM-5想簡單了。
接下來,我們上Claude Code,接智譜bigmodel.cn的API來測試。
我的需求很簡單,讓CC調用Skills一鍵把文章轉成視頻。
![]()
Skills是用的Remotion,安裝的話,我們直接跟CC說就行:
幫我從這個地址安裝Remotion Skills:https://github.com/remotion-dev/skills
需求看起來挺簡單,但對于模型來說,有很多開發工作要做,還要調用不同的工具,很考驗模型的Agentic能力。一開始我把這個需求提給GLM-5,其實我心里是沒底的。
不過在它工作了一會兒后,我覺得有底氣了。
![]()
它直接給我整了一個本地的視頻項目,可預覽,可渲染,還可以添加音頻(需要我給本地音頻,或者接AI Audio的API生成)。
![]()
我看了一下它寫的視頻預覽界面,我感覺好像進了剪映網頁版一樣,功能、組件都非常的全。
最后,直接讓它把視頻渲染出來,添加音樂后就得到了這樣一支視頻。
整個過程大概20來分鐘,一開始我是真沒底氣,但看到了最終的視頻成品,是真的。
這意味著,后面我可以把所有文章都丟給GLM-5,讓它幫我生成視頻。再接個Audio API,一個教程視頻半小時搞定。
這真的大大解放了我。
而我消耗的,無非是GLM的Coding Plan次數。大概率,他們家的Coding Plan這回又要賣爆,所以我提前直接整了個Max套餐。
![]()
智譜拼好模??
https://www.bigmodel.cn/glm-coding?ic=NCUSKSTEQQ
![]()
進入2026年,一切都在變快。
快到什么程度呢?快到我每天早上醒來,發覺昨天的消息已經不重要了。
從Claude Code到Skills,到Cowork,到OpenClaw,再到今天的GLM-5,以及呼之欲出的DeepSeek V4。
大家都在跑步邁入Agent、大任務時代,這對模型的Agentic能力提出了極高的要求。
海外有Claude、Gemini、GPT三雄爭霸,國內今天似乎也有了自己的答案:GLM-5。
前端能打,Agentic能干,以開源的底氣干到了Opus級的實力。
我知道,2026一定會很瘋狂,但沒想到會來得這般的快。
就好像,忽如一夜春風來,千樹萬樹梨花開。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.