金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
真是越到年底,越是神仙打架。
這不,智譜又又又發了新模型——GLM-4.7。
然后一舉在代碼競技場WebDev榜單上超越GPT-5.2,拿下開源大模型第一!
![]()
現在網友們也正在拿它瘋狂實測中,體驗完幾乎都是清一色的“Amazing”。
直接來感受一下網友拿著GLM-4.7和Gemini 3同時做的桌版溜溜球游戲,讓網友直呼:
- GLM-4.7完勝!
![]()
視頻地址:https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw
那么,為什么GLM-4.7這次會在編程效果上有這么大的進步?
就在今天早些時候,智譜還特意在Reddit上舉辦了一場AMA(Ask Me Anything)活動,關于背后的一切,都已經回答得清晰明了。
![]()
關于GLM-4.7,智譜回答一切
這場對話不僅揭示了GLM-4.7如何通過后訓練實現性能飛躍,還首次深度曝光了自研的強化學習框架——Slime。
我們整理了這場AMA的核心精華,看看這個被稱為“Claude Code最佳平替”的國產模型,究竟是怎么煉成的。
![]()
模型性能與優化
首先就是大家最為關心的,為什么GLM-4.7會在體感上有如此明顯的進步。
![]()
智譜團隊在AMA中明確表示,GLM-4.7的改進主要集中在后訓練階段。
在SFT(監督微調)和RL(強化學習)階段,團隊采用了更精細的發布配方(Release Recipe)。通過對不同領域數據集的對齊,模型不僅在基準測試上跑分更高,在實際部署中的穩定性也大幅提升。
而針對社區關于“為何不出更大參數量模型”的疑問,智譜團隊直言:
- 訓練成本和部署成本是設計的核心錨點。
GLM-4.7在設計之初就考慮了硬件限制。團隊目標是讓模型在消費級顯卡上也能跑出Air版本的靈活性,同時保持接近30B甚至更高規模的邏輯能力。這種在有限參數下壓榨極致性能的思路,正是為了讓AI真正落地。
![]()
除此之外,智譜分享了他們建立的一套復雜的預訓練數據流程:
- 多源采集: 涵蓋從高質量論文到小說等各類文本。
- 極致清理: 包含去重、質量過濾和敏感詞篩查。
- 對齊策略: 重點關注SFT和RL階段,讓寫作風格不再像機器人,而是更加生動細致。
模型應用場景與功能
如果說以前的GLM是個有些死板的理科生,那么4.7版本則是完成了一次情商逆襲。
在AMA中,開發者問得最多的就是編程。智譜團隊坦言,他們針對Claude Code做了大量的優化和適配工作。
目前,GLM-4.7在多語言編碼方面表現出色,不僅支持Python、JS,在一些相對冷門的語言和復雜的邏輯架構上也展現了極強的理解力。
團隊認為,智能體框架對性能的影響占比高達30%,因此GLM-4.7在系統提示詞、工具調用層級上做了深度打磨。
為了讓模型更像人,團隊從大量小說和劇本中汲取養分。
現在的GLM-4.7在創意寫作時,細節描寫更加豐富,不再只會說“在一個陽光明媚的下午”這種套話。在角色扮演任務中,它能更好地維持人設,減少出戲的頻率。
除此之外,GLM-4.7還引入了一個非常硬核的功能:交錯思考(Interleaved Thinking)。
![]()
在執行動作或調用工具之前,模型會先進行一段隱性思考。這種類似OpenAI o1的思維鏈機制,讓它在處理復雜的多模態任務(如看圖寫代碼、圖表分析)時,減少了魯莽操作的概率,提高了準確度。
技術方法與工具
智譜之所以在海外社區受歡迎,與其積極擁抱開源的態度密不可分。
這次AMA最讓人驚喜的莫過于Slime框架的公開。
為了解決大模型強化學習效率低、穩定性差的問題,智譜研發并開源了Slime。
![]()
這個框架專為大規模強化學習設計,支持多種對齊算法。它的名字寓意著“靈活且具有極強適應性”,能夠幫助開發者更容易地復現GLM級別的對齊效果。
智譜表示,他們從開源生態中獲益良多,因此也樂于回饋。
他們詳細描述了從數據收集、清理到質量過濾的完整流水線。這種透明度在目前的國產大模型廠商中并不多見,也贏得了LocalLLaMA社區的一致尊重。
在 Reddit 上,智譜團隊展現了極其接地氣的一面。
有用戶問:“你們訓練時遇到最意外的挑戰是什么?”
![]()
團隊回答:“最大的挑戰其實是發布配方。就像廚師手里有最好的食材(數據),但怎么掌握火候(RL參數)讓它在出鍋時最完美,往往需要無數次的推倒重來。”
還有人調侃:“GLM-4.7是不是吃了什么靈丹妙藥?”
團隊則幽默回應:“主要是我們學會了如何讓它在行動之前多想一想。”
實測GLM-4.7
在了解完GLM-4.7背后的“奇技淫巧”之后,我們還是老規矩,一波實測走起~
首先值得注意的是,現在在z.ai上搞開發,最好是點開“全棧開發”的按鈕:
![]()
然后我們先做一個植物大戰僵尸來小試牛刀,Prompt如下:
- 請基于當前目錄準備的素材(下載 https://z-cdn.chatglm.cn/temp/Grazy%20Dave.mp3 當作游戲音樂, 下載 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目錄下的各類植物與僵尸靜態/GIF圖片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif),做一個《植物大戰僵尸》游戲。

可以看到,同樣是經典的測試游戲,這次在體感上是“聲色俱全”的那種(體驗鏈接放下面了):
https://chat.z.ai/c/5415b1d8-ac01-4bc6-a24a-8e815c8fa361
除了游戲之外,GLM-4.7另一個體感上的躍遷,便是做PPT了,這個demo的Prompt極其簡單:
- 做一個介紹巴黎的PPT。
可以看到,PPT的效果已經達到了直接商用的程度:

除此之外,做海報也是GLM-4.7的一絕。
例如設計一張宣傳運動鞋的海報,對比GLM-4.6和GLM-4.7,效果的差距就一目了然了:
![]()
從種種效果來看,也就不難理解為什么這次GLM-4.7會在X上被刷屏了。
承諾上市后持續開源
在這次AMA中,除了技術硬核細節,圍觀群眾最關心的莫過于智譜要上市的事情了。
畢竟最近關于智譜擬赴港IPO的消息引發了圈內不小的關注。
Reddit上有資深老哥犀利發問:“一旦公司上市,你們是否會縮減開源投入?”
![]()
智譜團隊給出了一個非常堅定的定心丸:“開源是我們的核心基因,無論資本路徑如何變化,我們承諾上市后將持續開源。”
團隊解釋道,智譜深知其成長離不開開源生態的滋養。持續開源不僅是回饋,更是保持技術領先、建立開發者標準的最優路徑。這種“即便敲鐘,也要開卷”的姿態,確實讓不少海外開發者直呼“Respect”。
通過交錯思考提升智力上限,通過Slime框架規范訓練流程,智譜正在用最硬核的方式證明:國產模型不僅能跑分,更能實戰。
并且從用戶們的反饋來看,GLM-4.7以及智譜長期以來的工作也是被給予了高度的認可。
例如有網友從價格角度評價說:
- GLM 4.7的1年訂閱(接近Opus 4.5級別)= Codex/Claude Code的1個月Max Plan。
- 我現在就立馬訂一年的。
![]()
包括估值40億美元的Fireworks也在Day0支持GLM 4.7,嗯,美國人也是有更好的模型選擇了。
![]()
除此之外,在AMA的中,智譜團隊說了一句讓人期待的話:“我們會為了AGI在明年做更多的貢獻。”
![]()
在此基礎之上,智譜首席科學家唐杰在GLM-4.7發布之際發表了他對于大模型發展的一些觀點。
![]()
原鏈接:https://weibo.com/2126427211/QjIYhCmfq
在IPO的燈光亮起之前,智譜選擇先點亮開發者的屏幕。這種長期主義的浪漫,或許正是大模型時代最稀缺的底色。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.