網易首頁 > 網易號 > 正文申請入駐

智譜GLM-5強調的Agentic Engineering能力是什么？｜甲子光年

2026-02-12 20:44:51　來源: 甲子光年

北京舉報

分享至

智譜GLM-5驗證了Agentic Engineering的可行性，但成本正在變得更顯性。

作者｜周悅

編輯｜王博

今天，智譜上線并開源GLM-5，其在Coding與Agent能力上，取得開源SOTA表現，在真實編程場景的使用體感逼近 Claude Opus 4.5，擅長復雜系統工程與長程Agent任務。

在全球權威的Artificial Analysis榜單中，GLM-5位居全球第四、開源第一，圖片來源：智譜

這一發布直接刺激了資本市場，智譜股價一度漲超41%。截至收盤，智譜股價報402港元/股，漲幅為28.68%，市值為1792.3億港元。

值得注意的是，智譜稱GLM-5為“Agentic Engineering時代最好的開源模型”。

什么是Agentic Engineering？為什么智譜要強調這個概念呢？

1.從“氛圍”到“工程”

如果說AI行業需要尋找一位能精準捕捉技術風向的觀測者，特斯拉前AI總監、OpenAI創始成員Andrej Karpathy無疑是最佳人選。

2025年2月，他提出Vibe Coding（氛圍編碼）概念。開發者不再逐行寫代碼，而是用自然語言描述意圖，讓模型在一種更像即興創作的狀態里生成實現。這種體驗帶來了一段明顯的“編程蜜月期”：生成更快、試錯更便宜、上手更輕松。

但一年后，Karpathy拋出了一個更現實的概念：Agentic Engineering（代理工程）。他的關注點不再是單純地追求生成代碼，而是試圖讓AI交付完整的工程閉環。

從“氛圍”到“工程”的轉變，折射出一個更直觀的行業變化：寫代碼的門檻在降低，但讓模型跑完工程的門檻并沒有同步下降。

在「甲子光年」看來，要讓Agentic Engineering真的跑起來，需要滿足兩個條件：模型能力強，成本可接受。

我們把它粗略概括為一個便于理解的表達：Agentic Engineering的擴散性 ≈ 能力閾值 × 成本閾值。

前者決定可行性，后者決定普及率。沒有足夠的智能，循環會放大錯誤；能力足夠時，成本會變成新的瓶頸。這種范式往往會更早落在預算更充足、對收斂速度更敏感的團隊里。

今天，智譜GLM-5的發布與GLM Coding Plan價格體系調整，讓這兩個變量在同一個時間點上顯得更清晰。

Andrej Karpathy發布博文，圖片來源：X平臺

理解這次轉變，需要還原開發者的真實工作流。

在Vibe Coding時代，一個后端開發者使用Cursor等編程工具時，典型循環往往是：人類輸入—模型輸出—人類驗證—模型修改——人類確認。它提高了生成效率，但沒有消除人工介入的難題。

Karpathy對此的總結很精準：“很好、很有趣，而且幾乎能行得通。（It was good and fun and it almost worked）”

關鍵就在“幾乎”。

當任務開始變長、上下文變復雜、回歸測試變多時，人類介入的頻率并不會下降，開發者依然需要反復確認。瓶頸逐漸從代碼生成速度轉向開發者的驗證速度。

Agentic Engineering試圖打破的，正是這種線性依賴，讓模型把“找—改—測—再改—再測”的閉環盡量跑完，人類更多在關鍵節點介入，最終對結果負責。開發者的角色也隨之變化，從寫代碼的人變成更像“監督者”。

在這樣的語境下，GLM-5之所以值得被討論，是因為它為開源模型能否更接近代碼代理工作流，提供了一個可觀察樣本，也就是把公式左側的變量（能力閾值）推到了一個更高的位置。

根據智譜披露的結果，在衡量AI解決真實GitHub問題能力的權威榜單SWE-bench Verified上，GLM-5取得了77.8的成績，這一數據逼近了閉源模型的第一梯隊。與此同時，在部分第三方公開榜單下，GLM-5也處于開源模型的前列。

這些分數當然不是全部意義，但它們至少指向一個變化：在給定代碼倉庫、給定驗證條件的任務設定下，開源模型完成更長程的規劃、反思與自我修正，正在變得更可行。

大模型評估結果，圖片來源：智譜

從智譜披露的技術路徑來看，GLM-5在幾個關鍵維度上做了面向長流程任務的強化：

參數規模擴展：參數規模擴展至744B（激活40B），預訓練數據量提升，增強了通用智能；
異步強化學習：引入“Slime”框架和異步智能體強化學習算法，使模型能夠從長程交互中持續學習；
稀疏注意力機制：集成DeepSeek Sparse Attention，保證了在處理長上下文時的效果無損，提升token效率。

更值得注意的是，智譜表示，GLM-5已完成與華為昇騰、摩爾線程、寒武紀、昆侖芯、沐曦、燧原、海光等多家國產算力平臺的深度推理適配與優化。這說明，在部署路徑上，它正在探索一種更可落地的工程組合方式。

這共同指向了一個結論：開源模型在“更接近工程閉環”這一維度上，正在跨過更高的能力門檻。

2.現實的成本問題

當能力門檻被抬上去之后，公式右側的變量“成本閾值”會更快變成現實問題。

Agentic Engineering的核心邏輯是“循環”。一次真實的修復任務往往并不是一問一答，而是多輪定位、修改、測試與復盤。在這種模式下，Token消耗與推理時長通常會顯著高于普通對話。

換句話說，它不是“更省錢地寫代碼”，而是用更密集的算力去置換人類的時間。

2月12日，智譜發布價格調整說明，宣布 GLM Coding Plan取消首購優惠，整體價格上調，漲幅自30%起，將原因歸于需求增長與高負載下的穩定性與服務質量保障。

這些信息共同指向一個更明確的現實：當模型開始被更頻繁地當作生產力工具使用，成本會更早變成賬單。

因此，“漲價”本身不必被簡化為單一結論。更準確的說法是：能力閾值在上升，成本閾值也更顯性。

GLM-5的案例一定程度說明，未來的軟件工程可能會呈現出一種分層態勢：

在Vibe Coding層，對于日常、短程的輔助開發，低成本、快響應的模型依然是主流；
在Agentic Engineering層，面向關鍵任務、復雜架構調整或必須快速收斂的問題，更強的代理工程能力，更像一種需要付費的“加速券”——用更高的推理預算，換取更快的工程收斂。

對大公司和追求極致效率的團隊來說，這是一筆算得過來的投入；而對于更廣泛的個人開發者，這或許意味著需要更精細地計算 ROI（投資回報率）。

我們或許已經看到了一個更接近現實的結論：模型能力決定Agentic Engineering正在走向現實；成本，決定它能擴散到多遠。

（封面圖來源：AI生成）

聲明：包含AI生成內容

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

大模型最難的AI Infra，用Vibe Coding搞定

機器之心Pro 2026-01-07 15:33:06
0 跟貼 0
重塑軟件工程：從Vibe Coding走向Spec Coding

鈦媒體APP 2026-02-11 09:37:53
57 跟貼 57

懂人性更懂執行，螞蟻這個萬億開源模型把情商和戰斗力都給拉滿了

量子位 2026-02-19 12:45:37
2 跟貼 2

初創用3000萬造不可編程的AI芯片，推理速度是Nvidia最強GPU 50倍

DeepTech深科技 2026-02-21 18:28:56
1 跟貼 1
2026年，大模型訓練的下半場屬于「強化學習云」

機器之心Pro 2026-01-12 14:03:47
0 跟貼 0

具身數據戰開打！普通人都能上手，邊采邊篩，只喂機器人愛吃的

量子位 2026-01-12 12:20:02
0 跟貼 0

2026年的AI：向人立心，向實立命 | 2026商業新愿景

經濟觀察報 2026-02-14 11:20:06
0 跟貼 0
三維空間太難懂？2

機器之心Pro 2025-12-31 13:49:19
0 跟貼 0

1000 塊/年的輸入法，我用它習慣了「口噴」，再也回不去打字了 | AI 器物志

愛范兒 2026-02-21 18:39:19
3 跟貼 3
北大團隊讓AI智能體「入侵」論壇，指揮真實機器人執行任務

新智元 2026-02-21 12:03:31
1 跟貼 1
App Store模式過時，未來屬于即興創作！Karpathy激進言論被懟慘

機器之心Pro 2026-02-21 12:28:27
3 跟貼 3
機器人集體亮相春晚后：“假蔡明”被送給了真蔡明，“春晚版熊貓”拍出近6萬元高價

紅星新聞 2026-02-21 20:39:13
0 跟貼 0
微信聊天遭老板監視，主流殺毒軟件失明

每日經濟新聞 2025-12-25 19:02:17
0 跟貼 0
啟幕“十五五” | 2026 AI全鏈爆發：讀懂抓住機遇

通信世界 2026-02-21 22:02:05
0 跟貼 0
編程已死，鍵盤長草！Claude Code之父對談Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
63 跟貼 63
老外學會使用筷子，代碼以奇怪的方式運行，好一個熟練的鉗工！

小妹愛搞笑呢 2026-02-19 08:00:00
4 跟貼 4
公司985實習生，2分鐘解決團隊1周的bug，8年老程序笑笑不說話

靈犀愛說生活 2026-02-20 16:07:00
0 跟貼 0
“胡牌”像放技能一樣簡單？王者麻將之最無腦公式“三連+一對”

榮耀張大仙 2026-02-17 12:33:11
5 跟貼 5
陳丹琦入職Mira翁荔公司，原來是有IOI三金王賽友

量子位 2026-02-06 14:29:49
0 跟貼 0
中國常駐聯合國代表傅聰重申：日本沒資格要求入常

央視新聞客戶端 2026-02-21 08:01:36
3230 跟貼 3230
華為推出軟工代碼智能體SWE-Lego，解鎖SFT訓練極致性能

機器之心Pro 2026-01-13 14:54:45
0 跟貼 0
理解與尊重比協議更重要：扎哈羅娃眼中的中俄關系底層邏輯

創作者_7SAu 2026-02-21 03:03:54
0 跟貼 0
不但機械要厲害，控制的算法更厲害，網友瞬間不淡定了

姜江愛搞笑 2026-02-20 16:24:00
0 跟貼 0
為什么中國摩托，在非洲被印度三哥干掉了，背后邏輯很簡單！

笑到抽筋故事會 2026-02-20 16:28:00
0 跟貼 0
一夜變天？Claude出手，網絡安全股集體「血洗」！全球百億市值已蒸發

新智元 2026-02-21 12:02:56
0 跟貼 0
一通電話高情商求助：從小撒這通電話看向上溝通的底層邏輯

達達愛剪輯 2026-02-20 00:58:43
0 跟貼 0
專業度直接降維打擊，王孟源邏輯秒殺蔡正元！

huaser不花 2026-02-21 14:18:38
0 跟貼 0
OpenClaw 之父加入 OpenAI 前最后的訪談：你很難跟一個純粹為了好玩的人競爭

愛范兒 2026-02-20 17:25:49
3 跟貼 3
美軍開打前夕，俄交武器中方出手，殲20模型抵伊朗

戰武科普 2026-02-19 11:39:39
0 跟貼 0
學霸的秘密：看懂數學公式，掌握解題技巧！

誠躍紡織品2 2026-02-20 06:16:13
0 跟貼 0
掌握這個公式，數學滿分不是夢！

阿飛愛分享 2026-02-19 01:15:39
0 跟貼 0
35年社保！你絕對想不到的河南退休金究竟有多少！

三河王哥愛生活 2026-02-21 14:44:02
4 跟貼 4
李飛飛：這不是你一個人的路

筆記俠 2026-02-21 14:08:07
5 跟貼 5
痛心！樹齡1200年古樟持續燃燒7小時，只因倆小孩隨手扔爆竹

環球網資訊 2026-02-21 10:22:16
723 跟貼 723
特斯拉新車曝光：無方向盤、無踏板、無后視鏡

澎湃新聞 2026-02-21 02:12:18
1094 跟貼 1094
人氣火爆！江蘇無錫一景區發布限流公告

現代快報 2026-02-19 22:42:05
589 跟貼 589
谷歌突發Gemini 3.1 Pro！推理性能×2

量子位 2026-02-20 09:24:13
25 跟貼 25
西方隱瞞300年：現代文明一半源代碼是漢字，工業革命非英獨創

磁懸浮呆毛 2026-02-21 14:59:54
0 跟貼 0
嚴肅版AI編程助手 GitHub星標3k+

量子位 2025-12-08 15:29:06
0 跟貼 0
Claude Code之父，推特親傳使用技巧，超 500 萬人關注

機器之心Pro 2026-01-05 13:26:18
0 跟貼 0

甲子光年

中國科技產業化前沿智庫

3349文章數 9259關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

時尚

教育

房產

公開課

本地新聞

手機 / 數碼

房產 / 家居

智譜GLM-5強調的Agentic Engineering能力是什么？｜甲子光年

智譜上市1月漲5倍，市值超越京東、快手

消防車救火后返程墜崖6名消防員犧牲 村民:都是小伙子

消防車救火后返程墜崖6名消防員犧牲 村民:都是小伙子

冬奧第一"海王"？一人和13國選手都有關系

鏢人反超驚蟄無聲拿下單日票房第二！

一覺醒來，世界大變，特朗普改新打法了

態度原創

春花齊放2026：《駿馬奔騰迎新歲》

一年中最不能錯過的推送，超適合過年看！

孰對孰錯？媽媽要求孩子上交2萬壓歲錢，孩子不干！

窗前即地標！獨占三亞灣C位 自貿港總裁行宮亮相

消防車救火后返程墜崖6名消防員犧牲村民:都是小伙子

消防車救火后返程墜崖6名消防員犧牲村民:都是小伙子

窗前即地標！獨占三亞灣C位自貿港總裁行宮亮相