網易首頁 > 網易號 > 正文申請入駐

新“前端之父”來了！智譜深夜放出編程炸彈，開源第一、國產第一

2025-12-23 13:13:30　來源: 智東西

北京舉報

分享至

智東西
作者江宇
編輯漠影

智東西12月23日報道，今日，智譜正式上線并開源了新版本GLM-4.7，跑分直指開源第一梯隊。

GLM-4.7在SWE-bench、Terminal Bench 2.0、τ2-Bench、HLE等十余項智能體與推理評測中，全面對齊甚至部分超越GPT-5.1與Claude Sonnet 4.5。

而在訂閱門檻上，GLM-4.7堪比“價格屠夫”：每月最低20元即可使用Claude Pro三倍用量，主打一個“用得起”。

從技術上線時間點來看，這也是智譜在IPO前夜放出的關鍵一招。那么究竟效果如何？我們也第一時間在Z.ai上進行了實測。

GitHub：https://github.com/zai-org/GLM-4.5

Hugging Face：huggingface.co/zai-org/GLM-4.7

魔搭社區：https://modelscope.cn/models/ZhipuAI/GLM-4.7

一、從“寫代碼”到“管任務”，技術指標全線飄紅

根據Code Arena面向全球開發者的專業編碼盲測榜單，GLM-4.7在Web開發方向排名第六，成為目前全球排名最高的開源模型，超過GPT-5.2與Claude Sonnet 4.5，位列國產模型第一。

從更細致的基準測試來看，GLM-4.7最明顯的升級集中在三個方面：代碼、工具調用和推理能力。

在代碼能力上，它在SWE-bench?Verified拿到73.8%，LiveCodeBench?V6達到84.9%，整體水平已經對齊Claude Sonnet 4.5，在開源模型中處于第一梯隊。

在更偏復雜推理的任務中，HLE（“人類最后的考試”）成績提升尤為明顯，工具輔助條件下達到42.8%，相比GLM?4.6提升超過12個百分點，也超過了GPT?5.1 High。

工具調用能力同樣是這一代的重點方向，在τ2?Bench中，GLM?4.7拿到87.4%的成績，BrowseComp在開啟上下文管理后提升至67.5%，在多輪網頁任務和交互式工具調用場景中表現穩定，基本坐實了其“智能體向”模型的定位。

與這些分數變化對應的，是其內部思考機制的調整。

GLM?4.7在此前“交錯思考”的基礎上，引入了保留式思考與輪級思考控制：模型會在每次生成和工具調用前先進行推理，并在多輪任務中自動保留已有的思考結果，而不是反復從零開始推導。

同時，開發者也可以按輪次決定是否啟用推理過程，在簡單請求中降低時延，在復雜任務中換取穩定性。

這種設計更強調長任務執行中的一致性和可控性，也正是這些機制變化，支撐了它在代碼智能體、終端任務和工具協同類基準上的整體躍升。

此外，模型還針對前端美學、長文本穩定性、網頁生成結構等細節做了優化。

二、100個真實任務勝率更高，多模態技能調度能力打通開發閉環

為了驗證GLM?4.7在實際開發任務中的表現，智譜對比測試了100個真實編程任務，覆蓋前端開發、后端邏輯以及指令遵循等三個核心方向。結果顯示，在前端任務中，GLM?4.7相較4.6版本勝率提升至64.6%，在指令遵循場景中也達到58.3%。在最具工程復雜度的后端方向，其勝率也穩定在46.7%。

除了單點生成能力，GLM?4.7還進一步強化了多技能聯動能力。GLM-4.7已在Z.ai上線了全棧技能環境，它已接入全新的Skills模塊，支持調用ASR語音識別、TTS語音合成、GLM?4.6V視覺模型等多個模塊進行統一調度。

在多模態任務中，它既能規劃路徑、又能執行動作，工具之間的“調度邏輯”打通了。

三、實測：從3D圣誕樹到Switch小游戲，前端效果直追Gemini 3

本次我們通過Z.ai平臺測試了GLM-4.7的三類互動任務，來看看其在3D控制、UI生成與前端代碼實現上的表現。

場景1：3D圣誕樹炸開成照片墻，用手勢就能控制收放旋轉

這是本次測試中最具沉浸感的交互體驗之一。GLM-4.7輸出了一整段可直接運行的HTML代碼，包含完整的3D場景構建、粒子交互、手勢識別與UI反饋邏輯。

初始畫面是一棵由5000多個粒子構成的立體圣誕樹，頂部懸著一顆帶有輝光效果的星星。

移動鼠標時，粒子會自然產生斥力波紋，整體呈現出流動的視覺響應。

進入交互環節后，系統會調用攝像頭，識別用戶的手勢動作。當用戶張開手掌，整棵圣誕樹會突然炸開，轉變為一圈懸浮在空中的照片墻，照片以拍立得的形式環繞排布。如果繼續左右移動手掌，照片墻會跟隨旋轉。而當再次握拳時，所有元素會收攏歸位，照片墻重新收縮為圣誕樹形態，形成完整的一輪開合動畫。

此外，GLM-4.7還在代碼中集成了性能優化機制，例如使用InstancedMesh來渲染大量粒子，整個頁面在不依賴構建工具的前提下依然保持了高幀率與良好流暢度。

場景2：復刻iOS主界面，圖標齊了，界面能點

我們輸入提示詞“1:1復刻iOS系統”，GLM-4.7就做出了一個模仿iOS的主頁面：Safari、Siri、健康、錢包等圖標均可點擊。

日歷、天氣、計算器等功能頁可以進入交互，計算器還能進行基礎運算輸入。雖然和最新款iOS比起來還有細節差距，但整體體驗是流暢的、能用的，圖標風格和顏色搭配也有基本審美。

場景3：Switch格斗小游戲，手柄界面+按鍵聯動

我們還測試了一個雙人格斗游戲任務，GLM-4.7生成了一套完整的雙人對戰界面，整體風格高度還原Switch主機的Joy-Con手柄配色和布局：左側是藍色手柄，右側是紅色手柄，中間是游戲主屏幕。

進入游戲后，畫面中出現了兩個火柴人角色，一個為藍色玩家，一個為紅色敵人，頭頂有動態血條顯示。UI部分在左上角呈現當前波次與敵人數量等信息。在操作體驗上，左手玩家可以通過鍵盤A/D控制移動，J攻擊，K跳躍，右手玩家則使用U/I/O三鍵分別釋放技能。雖然尚未實現打擊判定與技能特效，但整體界面結構、角色邏輯和按鍵響應已經非常完整，具備真實游戲的框架感。

整個游戲內置了節奏感很強的格斗BGM。可見，GLM-4.7在UI構建、鍵盤監聽、動畫驅動等前端關鍵模塊中還是具備一定的可用性與穩定性。

結語：國產SOTA模型正值猛進階段

從三大基準維度到真實任務測試，GLM-4.7已躋身全球開源模型第一梯隊，成為國產模型在Agent工具線上的關鍵突破點。

無論是開源代碼在全球社區中已被下載超6000萬次，還是付費API使用量長期居于OpenRouter全球前十，都說明它已逐步進入開發者的實際工具列表。

而在GLM-4.7上線的節點背后，是智譜即將登陸港交所的背景，也是國產大模型企業從科研模型、開源生態向“真實使用”與“市場驗證”過渡的一個縮影。在這個新階段，開源國產模型正從“對標國際”邁向“領跑、實用”，而GLM-4.7就是這個進程中的一個關鍵代表。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.