<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      智譜公開GLM-5技術細節:四大創新推動編程范式轉變

      0
      分享至


      GLM-5推動編程范式從“Vibe Coding”轉向了“Agentic Engineering”。

      本文為IPO早知道原創

      作者|Stone Jin

      據IPO早知道消息,從Pony Alpha神秘模型引發全球開發者熱議起,智譜在過去兩三周的時間內無疑是全球最受關注的大模型企業。

      硅谷頂級風投機構a16z近日又發布了一組數據:開源大模型和頂級閉源模型之間的能力差距,正在以肉眼可見的速度快速收窄。這次被正面對標的正是智譜的開源模型 GLM-5以及閉源天花板之一的Claude Opus 4.6。


      從模型本身來看,GLM-5的發布某種程度上可被視為正推動編程范式從“Vibe Coding”(氛圍編程)轉向了“Agentic Engineering”(智能體工程)

      2月22日,智譜發布《GLM-5技術報告:技術細節全公開》并闡述稱,GLM-5 在前代模型 GLM-4.5 的智能體、推理與編程(Agentic, Reasoning and Coding, ARC)能力基礎上,采用稀疏注意力(DeepSeek Sparse Attention,DSA)以大幅降低推理成本,同時保持長上下文能力無損。同時,為了讓模型更好地與各類任務對齊,智譜構建了一套新型異步強化學習(RL)基礎設施,通過將生成過程與訓練過程解耦,從而大幅提升了后訓練的迭代效率。此外,智譜還提出了全新的異步 Agent 強化學習算法,進一步提升強化學習的效果,使模型能夠更有效地從復雜、長程交互中學習。基于上述創新,GLM-5 在主流的開放基準測試中實現了 SOTA 性能。最關鍵的是,GLM-5 在真實世界編程任務中展現出前所未有的能力,在處理端到端軟件工程挑戰方面超越了此前所有開源基線。

      總體而言,GLM-5 能夠實現性能的大幅躍升,主要得益于以下四大技術創新:

      1、引入 DSA 稀疏注意力機制(DeepSeek Sparse Attention, DSA)。這一全新架構極大降低了訓練與推理成本。此前的 GLM-4.5 依賴標準 MoE 架構提升效率,而 DSA 機制則使 GLM-5 能夠根據 Token 的重要性動態分配注意力資源。在不折損長上下文理解和推理深度的前提下,算力開銷得以大幅削減。得益于此,智譜將模型參數規模成功擴展至 744B(7440 億),同時將訓練 Token 規模提升至 28.5T(28.5 萬億)。

      2、構建全新的異步 RL 基礎設施。基于 GLM-4.5 時期 slime 框架“訓練與推理解耦”的設計,智譜的新基建進一步實現了“生成與訓練”的深度解耦,將 GPU 利用率推向極致。該系統支持模型開展大規模的智能體(Agent)軌跡探索,大幅減緩了以往拖慢迭代速度的同步瓶頸,讓 RL 后訓練流程的效率實現了質的飛躍。

      3、提出全新的異步 Agent RL 算法。該算法旨在全面提升模型的自主決策質量。GLM-4.5 曾依靠迭代自蒸餾和結果監督來訓練 Agent;而在 GLM-5 中,智譜研發的異步算法使模型能夠從多樣化的長周期交互中持續學習。這一算法針對動態環境下的規劃與自我糾錯能力進行了深度優化,這也正是 GLM-5 能夠在真實編程場景中表現卓越的底層邏輯。

      4、全面擁抱國產算力生態。從模型發布伊始,GLM-5 就原生適配了中國 GPU 生態。智譜已完成從底層內核到上層推理框架的深度優化,全面兼容七大主流國產芯片平臺:華為昇騰、摩爾線程、海光、寒武紀、昆侖芯、天數智芯與燧原。

      另外同樣需要注意的是,智譜繼續使用 slime 作為 GLM-5 統一的后訓練訓練框架,實現大規模端到端 RL。GLM-5 充分利用了 slime 的能力:一方面通過靈活的 rollout 定制化接口和服務化(server-based)的推理方案擴大訓練任務的覆蓋面;另一方面通過混合精度訓練 / rollout 以及多 token 預測(MTP)和預填充-解碼(PD)分離大幅降低延遲,特別是在多輪 RL 工作負載下的端到端延遲;并使用基于心跳的容災和生命周期管理提升穩定性。

      此外,GLM-5 在 slime 中進行了延遲導向的性能優化和調度:采用多節點推理部署(如跨 8 節點的 EP64 配合 DP64)以提供充足的 KV 緩存;使用 FP8 精度進行推理以降低每個 token 的解碼延遲;利用 MTP 來在 RL 中典型的小批次解碼場景下獲得顯著性能收益;通過 PD 分離確保在多輪交互的訓練任務中解碼速度的穩定,從而顯著改善長程 Agent RL 訓練中的長尾問題,提升訓練效率

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      以色列要求民眾立即進入避難設施

      以色列要求民眾立即進入避難設施

      界面新聞
      2026-02-28 16:16:15
      廣東一網紅寵物狗走失,監控拍到狗狗倒地抽搐被人帶走,主人已報警并懸賞尋線索

      廣東一網紅寵物狗走失,監控拍到狗狗倒地抽搐被人帶走,主人已報警并懸賞尋線索

      三湘都市報
      2026-02-28 12:33:29
      美國軍方預計將對伊朗進行為期多天的行動

      美國軍方預計將對伊朗進行為期多天的行動

      財聯社
      2026-02-28 15:55:12
      意外嗎?魯能一場2比9慘敗,彰顯了王大雷含金量,接班人遙遙無期

      意外嗎?魯能一場2比9慘敗,彰顯了王大雷含金量,接班人遙遙無期

      羅掌柜體育
      2026-02-27 16:57:36
      湖人內訌接連傳出!斯瑪特多次表達不滿,防守懶散,還拿自己當腕

      湖人內訌接連傳出!斯瑪特多次表達不滿,防守懶散,還拿自己當腕

      你的籃球頻道
      2026-02-28 10:11:44
      陳偉霆何穗春節在順義帶娃翻車 兩萬外套不抵五毛棒棒糖嗎

      陳偉霆何穗春節在順義帶娃翻車 兩萬外套不抵五毛棒棒糖嗎

      阿廢冷眼觀察所
      2026-02-28 10:59:12
      悲催!不自量力把婚離了,飯碗也碎了,50多歲保險女如今欲哭無淚

      悲催!不自量力把婚離了,飯碗也碎了,50多歲保險女如今欲哭無淚

      火山詩話
      2026-02-27 06:14:00
      雷克薩斯ES雙色特別版上市 售30.79萬元起

      雷克薩斯ES雙色特別版上市 售30.79萬元起

      車質網
      2026-02-26 09:20:11
      你在體制內捅過的最大簍子是啥? 網友:人怎么能捅這么大的簍子

      你在體制內捅過的最大簍子是啥? 網友:人怎么能捅這么大的簍子

      帶你感受人間冷暖
      2026-02-13 10:06:39
      南京市檔案館查到谷愛凌外婆馮國珍的珍貴歷史檔案,確定其為南京戶籍

      南京市檔案館查到谷愛凌外婆馮國珍的珍貴歷史檔案,確定其為南京戶籍

      極目新聞
      2026-02-27 10:42:46
      離婚次日,婆婆命令我伺候她住院七天,我打了一個電話婆婆傻眼

      離婚次日,婆婆命令我伺候她住院七天,我打了一個電話婆婆傻眼

      奶茶麥子
      2026-02-28 11:48:18
      普京不裝了!2500枚導彈連夜運抵伊朗,美軍這次踢到鐵板了!

      普京不裝了!2500枚導彈連夜運抵伊朗,美軍這次踢到鐵板了!

      局勢帝
      2026-02-27 18:08:52
      國家說要給你漲工資,這或許是最危險的好消息

      國家說要給你漲工資,這或許是最危險的好消息

      流蘇晚晴
      2026-01-17 19:43:15
      5胞胎在武漢順利出生,孩子爸爸稱名字已取好,回家就給老婆買黃金;專家曾建議減胎,但孩子父母不忍心

      5胞胎在武漢順利出生,孩子爸爸稱名字已取好,回家就給老婆買黃金;專家曾建議減胎,但孩子父母不忍心

      極目新聞
      2026-02-27 11:05:33
      宗馥莉在上海高檔餐廳露面,與外籍男士共進晚餐,同行女孩畫面溫馨

      宗馥莉在上海高檔餐廳露面,與外籍男士共進晚餐,同行女孩畫面溫馨

      東方不敗然多多
      2026-02-25 16:20:33
      環球影城:一游樂項目突發故障致2人重傷!索賠超30萬元!

      環球影城:一游樂項目突發故障致2人重傷!索賠超30萬元!

      特種設備安全科普
      2026-02-27 11:34:42
      樊振東到底做了什么?讓9連敗的他,終于贏了張本智和!

      樊振東到底做了什么?讓9連敗的他,終于贏了張本智和!

      曹老師評球
      2026-02-27 21:12:33
      樊振東也沒想到,德國總理訪華僅1天,自己竟因一段采訪口碑暴漲

      樊振東也沒想到,德國總理訪華僅1天,自己竟因一段采訪口碑暴漲

      寒士之言本尊
      2026-02-27 13:21:48
      許家印,在恒大王國里,過足了官癮、錢癮、色癮,金蟬脫殼玩死了

      許家印,在恒大王國里,過足了官癮、錢癮、色癮,金蟬脫殼玩死了

      混沌錄
      2025-09-12 00:29:10
      笑不活了!德媒急喊:總理,訪華千萬別跪!默茨的兩難,藏不住了

      笑不活了!德媒急喊:總理,訪華千萬別跪!默茨的兩難,藏不住了

      魏家東
      2026-02-27 15:50:13
      2026-02-28 16:56:49
      IPO早知道 incentive-icons
      IPO早知道
      IPO情報專家。
      6653文章數 2408關注度
      往期回顧 全部

      科技要聞

      狂攬1100億美元!OpenAI再創融資神話

      頭條要聞

      內塔尼亞胡:美以軍事行動目標是推翻伊朗政權

      頭條要聞

      內塔尼亞胡:美以軍事行動目標是推翻伊朗政權

      體育要聞

      球隊主力全報銷?頂風擺爛演都不演了

      娛樂要聞

      疑似王一博被爆私密聊天記錄

      財經要聞

      沈明高提共富建議 百姓持科技股國家兜底

      汽車要聞

      嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

      態度原創

      教育
      健康
      房產
      數碼
      公開課

      教育要聞

      我給兩會捎句話丨剛性保障中小學每天一節體育課

      轉頭就暈的耳石癥,能開車上班嗎?

      房產要聞

      濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

      數碼要聞

      聯想“ThinkBook 模塊化 AI PC”概念機將亮相 MWC

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版