金磊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
真是越到年底,越是神仙打架。
這不,智譜又又又發(fā)了新模型——GLM-4.7。
然后一舉在代碼競技場WebDev榜單上超越GPT-5.2,拿下開源大模型第一!
![]()
現(xiàn)在網(wǎng)友們也正在拿它瘋狂實測中,體驗完幾乎都是清一色的“Amazing”。
直接來感受一下網(wǎng)友拿著GLM-4.7和Gemini 3同時做的桌版溜溜球游戲,讓網(wǎng)友直呼:
- GLM-4.7完勝!
![]()
視頻地址:https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw
那么,為什么GLM-4.7這次會在編程效果上有這么大的進(jìn)步?
就在今天早些時候,智譜還特意在Reddit上舉辦了一場AMA(Ask Me Anything)活動,關(guān)于背后的一切,都已經(jīng)回答得清晰明了。
![]()
關(guān)于GLM-4.7,智譜回答一切
這場對話不僅揭示了GLM-4.7如何通過后訓(xùn)練實現(xiàn)性能飛躍,還首次深度曝光了自研的強化學(xué)習(xí)框架——Slime。
我們整理了這場AMA的核心精華,看看這個被稱為“Claude Code最佳平替”的國產(chǎn)模型,究竟是怎么煉成的。
![]()
模型性能與優(yōu)化
首先就是大家最為關(guān)心的,為什么GLM-4.7會在體感上有如此明顯的進(jìn)步。
![]()
智譜團隊在AMA中明確表示,GLM-4.7的改進(jìn)主要集中在后訓(xùn)練階段。
在SFT(監(jiān)督微調(diào))和RL(強化學(xué)習(xí))階段,團隊采用了更精細(xì)的發(fā)布配方(Release Recipe)。通過對不同領(lǐng)域數(shù)據(jù)集的對齊,模型不僅在基準(zhǔn)測試上跑分更高,在實際部署中的穩(wěn)定性也大幅提升。
而針對社區(qū)關(guān)于“為何不出更大參數(shù)量模型”的疑問,智譜團隊直言:
- 訓(xùn)練成本和部署成本是設(shè)計的核心錨點。
GLM-4.7在設(shè)計之初就考慮了硬件限制。團隊目標(biāo)是讓模型在消費級顯卡上也能跑出Air版本的靈活性,同時保持接近30B甚至更高規(guī)模的邏輯能力。這種在有限參數(shù)下壓榨極致性能的思路,正是為了讓AI真正落地。
![]()
除此之外,智譜分享了他們建立的一套復(fù)雜的預(yù)訓(xùn)練數(shù)據(jù)流程:
- 多源采集: 涵蓋從高質(zhì)量論文到小說等各類文本。
- 極致清理: 包含去重、質(zhì)量過濾和敏感詞篩查。
- 對齊策略: 重點關(guān)注SFT和RL階段,讓寫作風(fēng)格不再像機器人,而是更加生動細(xì)致。
模型應(yīng)用場景與功能
如果說以前的GLM是個有些死板的理科生,那么4.7版本則是完成了一次情商逆襲。
在AMA中,開發(fā)者問得最多的就是編程。智譜團隊坦言,他們針對Claude Code做了大量的優(yōu)化和適配工作。
目前,GLM-4.7在多語言編碼方面表現(xiàn)出色,不僅支持Python、JS,在一些相對冷門的語言和復(fù)雜的邏輯架構(gòu)上也展現(xiàn)了極強的理解力。
團隊認(rèn)為,智能體框架對性能的影響占比高達(dá)30%,因此GLM-4.7在系統(tǒng)提示詞、工具調(diào)用層級上做了深度打磨。
為了讓模型更像人,團隊從大量小說和劇本中汲取養(yǎng)分。
現(xiàn)在的GLM-4.7在創(chuàng)意寫作時,細(xì)節(jié)描寫更加豐富,不再只會說“在一個陽光明媚的下午”這種套話。在角色扮演任務(wù)中,它能更好地維持人設(shè),減少出戲的頻率。
除此之外,GLM-4.7還引入了一個非常硬核的功能:交錯思考(Interleaved Thinking)。
![]()
在執(zhí)行動作或調(diào)用工具之前,模型會先進(jìn)行一段隱性思考。這種類似OpenAI o1的思維鏈機制,讓它在處理復(fù)雜的多模態(tài)任務(wù)(如看圖寫代碼、圖表分析)時,減少了魯莽操作的概率,提高了準(zhǔn)確度。
技術(shù)方法與工具
智譜之所以在海外社區(qū)受歡迎,與其積極擁抱開源的態(tài)度密不可分。
這次AMA最讓人驚喜的莫過于Slime框架的公開。
為了解決大模型強化學(xué)習(xí)效率低、穩(wěn)定性差的問題,智譜研發(fā)并開源了Slime。
![]()
這個框架專為大規(guī)模強化學(xué)習(xí)設(shè)計,支持多種對齊算法。它的名字寓意著“靈活且具有極強適應(yīng)性”,能夠幫助開發(fā)者更容易地復(fù)現(xiàn)GLM級別的對齊效果。
智譜表示,他們從開源生態(tài)中獲益良多,因此也樂于回饋。
他們詳細(xì)描述了從數(shù)據(jù)收集、清理到質(zhì)量過濾的完整流水線。這種透明度在目前的國產(chǎn)大模型廠商中并不多見,也贏得了LocalLLaMA社區(qū)的一致尊重。
在 Reddit 上,智譜團隊展現(xiàn)了極其接地氣的一面。
有用戶問:“你們訓(xùn)練時遇到最意外的挑戰(zhàn)是什么?”
![]()
團隊回答:“最大的挑戰(zhàn)其實是發(fā)布配方。就像廚師手里有最好的食材(數(shù)據(jù)),但怎么掌握火候(RL參數(shù))讓它在出鍋時最完美,往往需要無數(shù)次的推倒重來。”
還有人調(diào)侃:“GLM-4.7是不是吃了什么靈丹妙藥?”
團隊則幽默回應(yīng):“主要是我們學(xué)會了如何讓它在行動之前多想一想。”
實測GLM-4.7
在了解完GLM-4.7背后的“奇技淫巧”之后,我們還是老規(guī)矩,一波實測走起~
首先值得注意的是,現(xiàn)在在z.ai上搞開發(fā),最好是點開“全棧開發(fā)”的按鈕:
![]()
然后我們先做一個植物大戰(zhàn)僵尸來小試牛刀,Prompt如下:
- 請基于當(dāng)前目錄準(zhǔn)備的素材(下載 https://z-cdn.chatglm.cn/temp/Grazy%20Dave.mp3 當(dāng)作游戲音樂, 下載 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目錄下的各類植物與僵尸靜態(tài)/GIF圖片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif),做一個《植物大戰(zhàn)僵尸》游戲。

可以看到,同樣是經(jīng)典的測試游戲,這次在體感上是“聲色俱全”的那種(體驗鏈接放下面了):
https://chat.z.ai/c/5415b1d8-ac01-4bc6-a24a-8e815c8fa361
除了游戲之外,GLM-4.7另一個體感上的躍遷,便是做PPT了,這個demo的Prompt極其簡單:
- 做一個介紹巴黎的PPT。
可以看到,PPT的效果已經(jīng)達(dá)到了直接商用的程度:

除此之外,做海報也是GLM-4.7的一絕。
例如設(shè)計一張宣傳運動鞋的海報,對比GLM-4.6和GLM-4.7,效果的差距就一目了然了:
![]()
從種種效果來看,也就不難理解為什么這次GLM-4.7會在X上被刷屏了。
承諾上市后持續(xù)開源
在這次AMA中,除了技術(shù)硬核細(xì)節(jié),圍觀群眾最關(guān)心的莫過于智譜要上市的事情了。
畢竟最近關(guān)于智譜擬赴港IPO的消息引發(fā)了圈內(nèi)不小的關(guān)注。
Reddit上有資深老哥犀利發(fā)問:“一旦公司上市,你們是否會縮減開源投入?”
![]()
智譜團隊給出了一個非常堅定的定心丸:“開源是我們的核心基因,無論資本路徑如何變化,我們承諾上市后將持續(xù)開源。”
團隊解釋道,智譜深知其成長離不開開源生態(tài)的滋養(yǎng)。持續(xù)開源不僅是回饋,更是保持技術(shù)領(lǐng)先、建立開發(fā)者標(biāo)準(zhǔn)的最優(yōu)路徑。這種“即便敲鐘,也要開卷”的姿態(tài),確實讓不少海外開發(fā)者直呼“Respect”。
通過交錯思考提升智力上限,通過Slime框架規(guī)范訓(xùn)練流程,智譜正在用最硬核的方式證明:國產(chǎn)模型不僅能跑分,更能實戰(zhàn)。
并且從用戶們的反饋來看,GLM-4.7以及智譜長期以來的工作也是被給予了高度的認(rèn)可。
例如有網(wǎng)友從價格角度評價說:
- GLM 4.7的1年訂閱(接近Opus 4.5級別)= Codex/Claude Code的1個月Max Plan。
- 我現(xiàn)在就立馬訂一年的。
![]()
包括估值40億美元的Fireworks也在Day0支持GLM 4.7,嗯,美國人也是有更好的模型選擇了。
![]()
除此之外,在AMA的中,智譜團隊說了一句讓人期待的話:“我們會為了AGI在明年做更多的貢獻(xiàn)。”
![]()
在此基礎(chǔ)之上,智譜首席科學(xué)家唐杰在GLM-4.7發(fā)布之際發(fā)表了他對于大模型發(fā)展的一些觀點。
![]()
原鏈接:https://weibo.com/2126427211/QjIYhCmfq
在IPO的燈光亮起之前,智譜選擇先點亮開發(fā)者的屏幕。這種長期主義的浪漫,或許正是大模型時代最稀缺的底色。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.