網易首頁 > 網易號 > 正文申請入駐

用編程大模型登頂開源第一后，智譜GLM團隊被拷問了3小時

2025-12-25 10:29:42　來源: 量子位

北京舉報

分享至

金磊發自凹非寺
量子位 | 公眾號 QbitAI

真是越到年底，越是神仙打架。

這不，智譜又又又發了新模型——GLM-4.7。

然后一舉在代碼競技場WebDev榜單上超越GPT-5.2，拿下開源大模型第一！

現在網友們也正在拿它瘋狂實測中，體驗完幾乎都是清一色的“Amazing”。

直接來感受一下網友拿著GLM-4.7和Gemini 3同時做的桌版溜溜球游戲，讓網友直呼：

GLM-4.7完勝！

視頻地址：https://mp.weixin.qq.com/s/AwYgbzPU6Gix61NpEMXezw

那么，為什么GLM-4.7這次會在編程效果上有這么大的進步？

就在今天早些時候，智譜還特意在Reddit上舉辦了一場AMA（Ask Me Anything）活動，關于背后的一切，都已經回答得清晰明了。

關于GLM-4.7，智譜回答一切

這場對話不僅揭示了GLM-4.7如何通過后訓練實現性能飛躍，還首次深度曝光了自研的強化學習框架——Slime。

我們整理了這場AMA的核心精華，看看這個被稱為“Claude Code最佳平替”的國產模型，究竟是怎么煉成的。

模型性能與優化

首先就是大家最為關心的，為什么GLM-4.7會在體感上有如此明顯的進步。

智譜團隊在AMA中明確表示，GLM-4.7的改進主要集中在后訓練階段。

在SFT（監督微調）和RL（強化學習）階段，團隊采用了更精細的發布配方（Release Recipe）。通過對不同領域數據集的對齊，模型不僅在基準測試上跑分更高，在實際部署中的穩定性也大幅提升。

而針對社區關于“為何不出更大參數量模型”的疑問，智譜團隊直言：

訓練成本和部署成本是設計的核心錨點。

GLM-4.7在設計之初就考慮了硬件限制。團隊目標是讓模型在消費級顯卡上也能跑出Air版本的靈活性，同時保持接近30B甚至更高規模的邏輯能力。這種在有限參數下壓榨極致性能的思路，正是為了讓AI真正落地。

除此之外，智譜分享了他們建立的一套復雜的預訓練數據流程：

多源采集：涵蓋從高質量論文到小說等各類文本。
極致清理：包含去重、質量過濾和敏感詞篩查。
對齊策略：重點關注SFT和RL階段，讓寫作風格不再像機器人，而是更加生動細致。

模型應用場景與功能

如果說以前的GLM是個有些死板的理科生，那么4.7版本則是完成了一次情商逆襲。

在AMA中，開發者問得最多的就是編程。智譜團隊坦言，他們針對Claude Code做了大量的優化和適配工作。

目前，GLM-4.7在多語言編碼方面表現出色，不僅支持Python、JS，在一些相對冷門的語言和復雜的邏輯架構上也展現了極強的理解力。

團隊認為，智能體框架對性能的影響占比高達30%，因此GLM-4.7在系統提示詞、工具調用層級上做了深度打磨。

為了讓模型更像人，團隊從大量小說和劇本中汲取養分。

現在的GLM-4.7在創意寫作時，細節描寫更加豐富，不再只會說“在一個陽光明媚的下午”這種套話。在角色扮演任務中，它能更好地維持人設，減少出戲的頻率。

除此之外，GLM-4.7還引入了一個非常硬核的功能：交錯思考（Interleaved Thinking）。

在執行動作或調用工具之前，模型會先進行一段隱性思考。這種類似OpenAI o1的思維鏈機制，讓它在處理復雜的多模態任務（如看圖寫代碼、圖表分析）時，減少了魯莽操作的概率，提高了準確度。

技術方法與工具

智譜之所以在海外社區受歡迎，與其積極擁抱開源的態度密不可分。

這次AMA最讓人驚喜的莫過于Slime框架的公開。

為了解決大模型強化學習效率低、穩定性差的問題，智譜研發并開源了Slime。

這個框架專為大規模強化學習設計，支持多種對齊算法。它的名字寓意著“靈活且具有極強適應性”，能夠幫助開發者更容易地復現GLM級別的對齊效果。

智譜表示，他們從開源生態中獲益良多，因此也樂于回饋。

他們詳細描述了從數據收集、清理到質量過濾的完整流水線。這種透明度在目前的國產大模型廠商中并不多見，也贏得了LocalLLaMA社區的一致尊重。

在 Reddit 上，智譜團隊展現了極其接地氣的一面。

有用戶問：“你們訓練時遇到最意外的挑戰是什么？”

團隊回答：“最大的挑戰其實是發布配方。就像廚師手里有最好的食材（數據），但怎么掌握火候（RL參數）讓它在出鍋時最完美，往往需要無數次的推倒重來。”

還有人調侃：“GLM-4.7是不是吃了什么靈丹妙藥？”

團隊則幽默回應：“主要是我們學會了如何讓它在行動之前多想一想。”

實測GLM-4.7

在了解完GLM-4.7背后的“奇技淫巧”之后，我們還是老規矩，一波實測走起~

首先值得注意的是，現在在z.ai上搞開發，最好是點開“全棧開發”的按鈕：

然后我們先做一個植物大戰僵尸來小試牛刀，Prompt如下：

請基于當前目錄準備的素材（下載 https://z-cdn.chatglm.cn/temp/Grazy%20Dave.mp3 當作游戲音樂，下載 https://z-cdn.chatglm.cn/temp/pvc-images.zip 目錄下的各類植物與僵尸靜態/GIF圖片、Pea.png/PeaSnow.png豆子素材、Shop.png/Card.png界面素材及Sun.gif），做一個《植物大戰僵尸》游戲。

可以看到，同樣是經典的測試游戲，這次在體感上是“聲色俱全”的那種（體驗鏈接放下面了）：
https://chat.z.ai/c/5415b1d8-ac01-4bc6-a24a-8e815c8fa361

除了游戲之外，GLM-4.7另一個體感上的躍遷，便是做PPT了，這個demo的Prompt極其簡單：

做一個介紹巴黎的PPT。

可以看到，PPT的效果已經達到了直接商用的程度：

除此之外，做海報也是GLM-4.7的一絕。

例如設計一張宣傳運動鞋的海報，對比GLM-4.6和GLM-4.7，效果的差距就一目了然了：

從種種效果來看，也就不難理解為什么這次GLM-4.7會在X上被刷屏了。

承諾上市后持續開源

在這次AMA中，除了技術硬核細節，圍觀群眾最關心的莫過于智譜要上市的事情了。

畢竟最近關于智譜擬赴港IPO的消息引發了圈內不小的關注。

Reddit上有資深老哥犀利發問：“一旦公司上市，你們是否會縮減開源投入？”

智譜團隊給出了一個非常堅定的定心丸：“開源是我們的核心基因，無論資本路徑如何變化，我們承諾上市后將持續開源。”

團隊解釋道，智譜深知其成長離不開開源生態的滋養。持續開源不僅是回饋，更是保持技術領先、建立開發者標準的最優路徑。這種“即便敲鐘，也要開卷”的姿態，確實讓不少海外開發者直呼“Respect”。

通過交錯思考提升智力上限，通過Slime框架規范訓練流程，智譜正在用最硬核的方式證明：國產模型不僅能跑分，更能實戰。

并且從用戶們的反饋來看，GLM-4.7以及智譜長期以來的工作也是被給予了高度的認可。

例如有網友從價格角度評價說：

GLM 4.7的1年訂閱（接近Opus 4.5級別）= Codex/Claude Code的1個月Max Plan。
我現在就立馬訂一年的。

包括估值40億美元的Fireworks也在Day0支持GLM 4.7，嗯，美國人也是有更好的模型選擇了。

除此之外，在AMA的中，智譜團隊說了一句讓人期待的話：“我們會為了AGI在明年做更多的貢獻。”

在此基礎之上，智譜首席科學家唐杰在GLM-4.7發布之際發表了他對于大模型發展的一些觀點。

原鏈接：https://weibo.com/2126427211/QjIYhCmfq

在IPO的燈光亮起之前，智譜選擇先點亮開發者的屏幕。這種長期主義的浪漫，或許正是大模型時代最稀缺的底色。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.