魚羊 henry 發自 麥蒿寺
量子位 | 公眾號 QbitAI
2025倒計時,新SOTA模型涌現沒有放緩跡象。
一夜之間,編程SOTA模型易主,而且上線即開源,依然來自中國大模型公司——
智譜AI,GLM-4.7。
![]()
這波更新,技術報告里滿眼都是Coding,Coding,還是Coding。
而能力的提升,帶來的最直觀效果是:
AIME 25和人類最后考試(HLE)等基準中,GLM-4.7分數超GPT-5.1;
SWE-Bench分數達(73.8%,+5.8%),創開源新高。
官方Demo顯示,寫個植物大戰僵尸不費勁:

總而言之,模型這么一發,雙旦的節慶氛圍一下到位了(doge)。
![]()
官網Chatbot和API均已就位,現在就能在線開玩。
Demo來吧,展示
在前端生成質量上,GLM-4.7展現出明顯升級:頁面結構更干凈、組件層級更清晰。

相比GLM-4.6,更像是現代的Web UI,網友元素中更加美觀。


在PPT與視覺物料生成方面,GLM-4.7標題層級明確、元素尺寸更合理。

在復雜幾何結構與空間關系的表達上,GLM-4.7模型能夠保持較好的結構一致性與細節穩定性。


3D資產的生成質量也有顯著提升。


刷新開源SOTA
這次最新的模型主打編程,相較前代GLM-4.6,GLM-4.7在編碼能力、交互體驗與復雜推理等多個維度實現了系統性升級。
![]()
- 復雜推理能力(Reasoning):全面提升,HLE(含工具)42.8(+12.4 vs GLM-4.6),MMUL-Pro 84.3,GPQA-Diamond 85.7,數學與推理能力更穩更強。
- 核心編碼能力(Code Agent):多語言與終端任務顯著增強,SWE-bench Verified 73.8(+5.8)、SWE-bench Multilingual 66.7(+12.9)、Terminal Bench 2.0 41.0(+16.5),支持“先思考、再行動”模式。
- 工具使用能力(General Agent):工具調用更高效,BrowseComp 52.0(+6.9)、BrowseComp w/ Context Management 67.5(+10.0)、τ2-Bench 87.4(+12.2),網頁瀏覽與工具鏈管理表現更優。
此外,GLM-4.7在對話、創意寫作、角色扮演等場景中同樣有提升,系統性增強了編碼、推理與工具使用能力。
![]()
交錯式思考和保留式思考
技術方面,GLM-4.7強化了自GLM-4.5起引入的交錯式思考(Interleaved Thinking),并進一步引入了保留式思考(Preserved thinking)和輪級思考(Turn-level Thinking)。
交錯式思考
GLM在工具調用之間、收到工具結果之后繼續思考。
這讓模型能夠進行更復雜的分布推理,提升了指令遵從和生成質量:
在決定下一步行動前先解讀每次的工具輸出,把多次工具調用和推理步驟串聯起來,并根據中間結果做出更細粒度的決策。
![]()
保留式思考
在編碼場景中,GLM-4.7引入了一種新的思考模式:
模型會自動在多回合對話中保留所有思考快,復用已有推理而不是從頭重新推理。這減少了信息丟失和不一致性,使得模型更適用于長程、復雜任務。還能在真實任務中節省更多tokens。
![]()
輪級思考
輪級思考是一種按輪控制推理計算的能力,即在同一個會話中,每一輪請求都可以獨立選擇開啟/關閉思考。
這使得GLM-4.7具備以下優勢:
- 更靈活的成本/時延控制:對“問個事實/改個措辭”等輕量輪次可關閉思考,追求快速響應;對“復雜規劃/多約束推理/代碼調試”等重任務輪次可開啟思考,提升正確率與穩定性。
- 更順滑的多輪體驗:思考開關在會話內可隨時切換,模型能在不同輪次間保持對話連貫與輸出風格一致,讓用戶感覺“聰明時更聰明、簡單時更快”。
- 更適合Agent/工具調用場景:在需要快速執行的工具輪次可降低推理開銷,在需要綜合工具結果做決策的輪次再開啟深度思考,實現效率與質量的動態平衡。
![]()
更多技術詳情,智譜官方也附上了詳細技術報告。
BTW,智譜這個月還真上了“節日限定優惠”。
![]()
每月最低20元即可暢享GLM-4.7,用上Claude Pro套餐3倍用量。
![]()
又是一位好價格屠夫呀。
![]()
而且GLM-4.7的深夜炸場,也算是已經沖刺IPO上市的智譜,帶來的最新技術證明。
目前智譜已經通過了港交所上市聆訊,IPO敲鐘僅剩下最后100米。
而GLM-4.7可能也是智譜上市之前,最重要的模型更新了……吧?
[1]https://z.ai/blog/glm-4.7
[2]https://x.com/Zai_org/status/2003156119087382683
— 完 —
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.