網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

實測DeepSeek vs GLM-5，中國AI殺瘋了，程序員危！！

2026-02-12 13:36:28　來源: 沃垠AI

四川舉報

分享至

大家好，我是冷逸。最近，中國模型殺瘋了，我也快忙瘋了。

進(jìn)入2026年，感覺我每天16個小時都泡在AI里，也追不上AI進(jìn)化的速度。每天一睜眼，世界就變了樣。

就這幾天，Seedance 2.0以極強(qiáng)的導(dǎo)演級AI能力登頂視頻王座。就在昨晚，悄悄上線了最新模型。而就在剛剛，智譜AI也發(fā)布了全新的基座模型GLM-5。

這是它的bench得分。與自己的GLM-4.7比，大幅提升；與御三家相比，也互有勝負(fù)。

真的，麻了。

大家都在快快快快快，我也跟著追追追追追。

好好好，既然都在一個時間上線，那我就一起做期橫評吧。

橫評GLM-5與DeepSeek

DeepSeek新模型，測試渠道是在DeepSeek官網(wǎng)（已確認(rèn)使用的是最新版）。

GLM-5是在Z.ai測試，主要是Chat模式。

1）推理：經(jīng)典洗車難題

先來一道最近熱門的「洗車難題」，據(jù)說把ChatGPT、Claude、Gork、豆包、千問、元寶都給干趴下了。

我想去洗車，洗車店距離我家50米，你說我應(yīng)該開車過去還是走過去？

都開啟Thinking模式，DeepSeek直接明了：開過去。

GLM-5也是建議開過去。

同時，它還給了2種最佳操作方案。如果店里是人工精洗，那就把鑰匙給店員，自己回家休息。如果是機(jī)洗，建議洗完再兜個圈，讓車身上的風(fēng)把水吹干。

你別說，GLM-5這還考慮得挺全面的。

但如果不開Thinking模式，我發(fā)覺他倆就大相徑庭了。GLM仍是讓開過去，畢竟洗的是車。DeepSeek則說走過去，因為“50米開車屬于‘無效磨損’”……

確實，非Thinking模式下，DS容易出錯。

2）前端：信息圖

日常發(fā)文章，我會經(jīng)常用到一張信息圖，多數(shù)情況我都是用Gemini 3 Pro生成。

提示詞是：

提煉下面內(nèi)容的核心關(guān)鍵點(diǎn)，創(chuàng)建一個HTML網(wǎng)頁。
文字內(nèi)容：
{
你的內(nèi)容
}
網(wǎng)頁的設(shè)計要求如下：
1.視覺設(shè)計：采用{Magazine Layout}風(fēng)格布局，{深色}主題色，營造現(xiàn)代高端氛圍。
2.字體與排版：
·使用超大字體或數(shù)字突出核心要點(diǎn)，中文采用大號粗體，強(qiáng)調(diào)視覺沖擊力。
·英文使用小號字體作為點(diǎn)綴，與中文形成比例反差，提升設(shè)計層次感。
3視覺元素：
·融入超大視覺元素（如標(biāo)題、背景圖或裝飾）以突出重點(diǎn)，與小型元素形成強(qiáng)烈對比。
·使用簡潔的勾線風(fēng)格圖形作為數(shù)據(jù)可視化或配圖元素，保持現(xiàn)代感和清晰度。
4.色彩與效果：運(yùn)用高亮色（單色透明度漸變）營造科技感，每種高亮色獨(dú)立使用，避免不同高亮色之間的漸變混雜。
5.技術(shù)要求：引入專業(yè)圖標(biāo)庫（如Font Awesome或Material Icons，通過CDN加載），避免使用emoji作為主要圖標(biāo)。
6.內(nèi)容要求：提煉內(nèi)容關(guān)鍵要點(diǎn)，不忽略重要細(xì)節(jié)。

我整理了GLM-5的一些資料，讓DeepSeek和GLM-5都生成一下。

先看DeepSeek的。

整體版式ok，數(shù)字和關(guān)鍵詞的視覺張力也都有，色彩也是AI常見的青、藍(lán)、紫色。但簡潔線條有點(diǎn)過于豐富了，再加上過多的圖標(biāo)，反而不太好看。

再來看下GLM-5的。

倒是簡單明了，層次分明，小字、大字和數(shù)字錯位排版。用的圓角UI，比DeepSeek也入眼了一些。如果是網(wǎng)頁瀏覽，還有懸停動畫和光暈視差。

順手，我還用Gemini 3 Pro生成了下。

單這個信息圖Case來說，我感覺GLM-5和Gemini 3不相上下。

3）前端：設(shè)計完整網(wǎng)站

前幾天，我給大家介紹了一個有意思的產(chǎn)品：。

很多人想體驗，但我發(fā)現(xiàn)他們沒有官方網(wǎng)站。現(xiàn)在，我讓DeepSeek和GLM-5分別搓一個。

提示詞很簡單，我都懶得描述，直接讓AI讀我的文章來設(shè)計網(wǎng)站。

給這篇文章的產(chǎn)品寫一個宣傳網(wǎng)頁： https://mp.weixin.qq.com/s/KM0youAHaJLq45UO3v-L5w

先看GLM-5的。

第一次打開網(wǎng)站，說實話，我有點(diǎn)被驚到了。它在首頁做了一個模擬抖音的故障藝術(shù)效果，紫色主色調(diào)+青粉色的霓虹點(diǎn)綴耐看，也符合產(chǎn)品的調(diào)性。

核心板塊，Hero、功能、案例、創(chuàng)作以及下載指引，該有的都有。而且，GLM對Logo的提煉非常精準(zhǔn)，實際上我并沒有告訴他它。

整體看下來，我覺得這就是我想要的產(chǎn)品官網(wǎng)。Loopit的朋友，可以私聊我要源碼了。

然后，我們來看看DeepSeek交的。

還蠻好玩的，用鼠標(biāo)點(diǎn)一下就會隨機(jī)出現(xiàn)一些字或者圖標(biāo)，確實魔性。

但我覺得它不是產(chǎn)品官網(wǎng)，如果我要真的上架，要改動的地方還不少。不知道大家怎么看這組對比，歡迎評論區(qū)告訴我。

4）3D：魔方模擬器

這是x上（@Ryan Lazuka）的一個提示詞。

提示詞：Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself. 
中文：創(chuàng)建一個HTML文件，其中使用Three.js（通過CDN方式引入）來實現(xiàn)一個功能完備的3D魔方模擬程序。該魔方必須能夠自動完成自己的“解謎”過程。

要能夠記住魔方的打亂步驟，并反向求解，這特別考驗?zāi)Ｐ偷耐评砗陀嬎隳芰Α?/p>

先看下DeepSeek的，它就自己一個人在那玩（演示），完全不讓用戶玩，大概率是生成失敗了。

再來看下GLM-5的，基本還原出來了。在隨機(jī)打亂后，魔方能自動逆向還原，不會出錯。

歡迎大家體驗：https://chat.z.ai/space/z1y9j1cck7p0-art

總結(jié)一下：在前端這塊，從審美到3D，到計算能力，我認(rèn)為GLM-5的表現(xiàn)都要優(yōu)于DeepSeek新模型，甚至能夠與Gemini 3 Pro扳手腕。

當(dāng)然，DeepSeek本身也不差，而且在“架構(gòu)瘦身”和“智商擴(kuò)容”上有很多創(chuàng)新。而他倆都開源，都Media in China。

也難怪，最近x上有很多老外在瘋狂求魔法，求手機(jī)賬號，來體驗我們中國的模型。

Agentic測試：一鍵做視頻

但如果只是測前端、One Shot的話，我覺得把GLM-5想簡單了。

接下來，我們上Claude Code，接智譜bigmodel.cn的API來測試。

我的需求很簡單，讓CC調(diào)用Skills一鍵把文章轉(zhuǎn)成視頻。

Skills是用的Remotion，安裝的話，我們直接跟CC說就行：

幫我從這個地址安裝Remotion Skills：https://github.com/remotion-dev/skills

需求看起來挺簡單，但對于模型來說，有很多開發(fā)工作要做，還要調(diào)用不同的工具，很考驗?zāi)Ｐ偷腁gentic能力。一開始我把這個需求提給GLM-5，其實我心里是沒底的。

不過在它工作了一會兒后，我覺得有底氣了。

它直接給我整了一個本地的視頻項目，可預(yù)覽，可渲染，還可以添加音頻（需要我給本地音頻，或者接AI Audio的API生成）。

我看了一下它寫的視頻預(yù)覽界面，我感覺好像進(jìn)了剪映網(wǎng)頁版一樣，功能、組件都非常的全。

最后，直接讓它把視頻渲染出來，添加音樂后就得到了這樣一支視頻。

整個過程大概20來分鐘，一開始我是真沒底氣，但看到了最終的視頻成品，是真的。

這意味著，后面我可以把所有文章都丟給GLM-5，讓它幫我生成視頻。再接個Audio API，一個教程視頻半小時搞定。

這真的大大解放了我。

而我消耗的，無非是GLM的Coding Plan次數(shù)。大概率，他們家的Coding Plan這回又要賣爆，所以我提前直接整了個Max套餐。

智譜拼好模??

https://www.bigmodel.cn/glm-coding?ic=NCUSKSTEQQ

進(jìn)入2026年，一切都在變快。

快到什么程度呢？快到我每天早上醒來，發(fā)覺昨天的消息已經(jīng)不重要了。

從Claude Code到Skills，到Cowork，到OpenClaw，再到今天的GLM-5，以及呼之欲出的DeepSeek V4。

大家都在跑步邁入Agent、大任務(wù)時代，這對模型的Agentic能力提出了極高的要求。

海外有Claude、Gemini、GPT三雄爭霸，國內(nèi)今天似乎也有了自己的答案：GLM-5。

前端能打，Agentic能干，以開源的底氣干到了Opus級的實力。

我知道，2026一定會很瘋狂，但沒想到會來得這般的快。

就好像，忽如一夜春風(fēng)來，千樹萬樹梨花開。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.