放假回來了,回來了,
幸好假期內沒發新模型了,現在火的是節前最后兩天前后腳發布的DeepSeek-V3.2-Exp和GLM-4.6。
![]()
一個降價75%,
一個登頂Hugginface第一和openrouter趨勢榜第一
![]()
![]()
那我立刻馬上光速立刻掏出假期整理好大模型噩夢級測試案例1.0版,
平時自己測,看別人測,看大模型自己測,都快看膩了,花了點時間歸納了一下,截止到2025年10月9號,
主流的單case測試(特指非數據集)主要分為物理模擬、SVG、前端設計、可交互3D四大類,
今天我一口氣全測完,還要帶上DeepSeek V3.2,測評方式還是老規矩啊,公開所有提示語,每個模型跑三次,取效果最好的一次作為最終結果。
有些提示語比較長,以及連同輸出的代碼和效果我都打包到文檔了,公眾號后臺發“dsglm”就好啦。
先來個常見的物理模擬熱熱身,
用 HTML、CSS 和 JavaScript 實現這樣一個效果:一個小球被困在一個旋轉的六邊形內部。小球受到地球重力的作用,并與六邊形內壁產生摩擦。小球的彈跳需要看起來逼真自然。
GLM-4.6:
DeepSeek V3.2:
雖然沒明說,但GLM-4.6和DeepSeek V3.2不約而同都選擇了提供參數調整項,可以重置小球,加速和減速六邊形的旋轉速度,還可以取消動力,我記得DeepSeek R1那會小球能模擬出重力就已經算厲害的了。GLM-4.6還增加了重力參數,小球大小,甚至還有摩擦力。
再來試試看畫SVG,
繪制一個騎自行車的鵜鶘的 SVG 圖像
![]()
這也是一個成名已久的超絕測試了,
GLM-4.6(左側)基本上元素都畫出來了,有板有眼的,就是鵜鶘坐的位置有點低,DeepSeek V3.2(右側)畫出來的鵜鶘實現了腳身分離,方向也反了,車把也沒了。
我還找到了另外16個模型的跑出來的鵜鶘,有的車把沒了,有的鳥沒了,有的頭反方向了,有的都不在車喪,甚至有的車都沒有畫出來。
![]()
就這個測試它居然還有升級版,讓鵜鶘騎自己。。。。
繪制一幅鵜鶘騎著另一只鵜鶘的 SVG 圖像
![]()
大家有猜到哪個是GLM-4.6做的嗎?
接著測測UI組件,說實話測天氣組件已經測累了,來整點不一樣的儀表盤,
設計一個響應式的儀表盤(Dashboard)界面,包含導航欄、數據可視化圖表和用戶設置面板。使用諸如 Tailwind 這樣的現代 CSS 框架。確保界面對所有用戶都具備良好的可訪問性,并在移動端同樣兼容、顯示正常。
GLM-4.6:
DeepSeek V3.2:
提示語里要求的元素兩個模型都是實現出來了,比的就是細節,GLM-4.6里的圖標當鼠標移動過去的時候能展示出具體的細節,還可以順利切換主題顏色,以及部分修改用戶信息。
再再再來點怪的,讓它們復刻我天天見的界面,
幫我做一個 Excel 的克隆版本,但只需要前端部分。
GLM-4.6:
DeepSeek V3.2:
這case還蠻新的,我是真沒想到加粗、斜體、下劃線都能實現出來,甚至連sum公式,單元格合并等也做出了接口,不過因為選不了多個單元格,這些功能沒有起作用。比起DeepSeek V3.2,GLM-4.6還把居中、偏左偏右,單個單元格的復制黏貼剪切做出來了,照這樣下去,Claude提出的Imagine with Claude,通過模型實時生成各種軟件原型的理念真不遠。
最后來個可交互的3D界面,
創建一個交互式的 3D 粒子宇宙,包含 3 種模式,并能實時渲染多達 10,000 個粒子,呈現具有空間深度效果的三維視覺體驗。使用 Three.js 實現。
GLM-4.6:
DeepSeek V3.2:
GLM-4.6同樣習慣性提供了更多的參數,可控調整的細節也更多,開3倍速的10000顆粒子迎面沖來的感覺,我感覺自己在穿越時間。
最后的最后,
來看看GLM-4.6怎么接入最新版本的Claude Code V2.0吧,Claude Code的安裝方法沒啥變化,還是固定的3條
npm install -g @anthropic-ai/claude-code
export ANTHROPIC_BASE_URL=https://api.z.ai/api/anthropic
export ANTHROPIC_AUTH_TOKEN=你獲得的APIkey
![]()
這個版本最大好處就是新增了檢查點,可以回滾到之前的狀態,按 Esc 兩次或使用 /rewind 可選擇恢復代碼或者對話。
配合GLM-4.6的超低價,我都想不出我要自己寫代碼的理由。
買Coding Plan套餐包的話,是 1.99元/百萬tokens,比 DeepSeek v3.2還便宜,均下來是Claude Sonnet 4.5的1/20到1/50,平均token消耗比GLM-4.5 省了30%左右,之前訂閱過的會自動升級到GLM-4.6。
https://zhipuaishengchan.datasink.sensorsdata.cn/t/Vh
寫到這,有點想聊聊作為一個每天還要寫代碼的程序員對AI編程的想法,
剛開始是不舍得用,額度一下子就沒了,還會埋很多暗坑,過一段時間后,我特別喜歡用AI來寫單元測試,或者編程語言的轉換,把python轉成sql啥的,不需要我去翻文檔要導入什么包,安裝什么環境,方便很多。
再后來,token大白菜了,我會在Cursor上把一些好用的github項目封裝成說明書,讓AI自己理解自己寫,
![]()
最近就更過分了,
因為我給自己的定位并不是那種遇到什么問題都嘗試寫個程序去解決的極客man,
我都是等要用了臨時學兩手,立馬解決問題。
所以編程對我來說更多是個工具,尤其是看到前人留下來的shi山代碼,我的心已經比殺魚十年的還要冷了,
但AI編程讓我感覺回到了很久很久之前,拿著本C# 就敢去開發的勁了,
就好像沒有什么是一行代碼解決不了,
有的話,
多寫兩行就好了。
最后最后最后追后,
歡迎用我的邀請碼,首buy五折加邀請碼再減10%,我也能回血點積分
![]()
@ 作者 / 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論
如果想要第一時間收到推送,不妨給我個星標
更多的內容正在不斷填坑中……
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.