<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      編程超越 Gemini 3 Pro?GLM-5 性能實測對齊 Opus 4.6,智譜市值突破1700億港元

      0
      分享至


      整理 | 華衛(wèi)

      臨近春節(jié),智譜 AI 發(fā)布了其最新旗艦大模型 GLM-5。自 1 月初在香港進行備受關(guān)注的 IPO 之后,這是該公司推出的首款重磅大模型。


      據(jù)稱,GLM-5 標(biāo)志著人工智能開發(fā)從“Vibe Coding”變革為“Agentic Engineering”,即更大規(guī)模的 AI 自動化編程,其代碼能力實現(xiàn)跨越式提升。該公司的內(nèi)部測試顯示,GLM-5 在代碼能力、智能體表現(xiàn)等關(guān)鍵領(lǐng)域的開源模型評分中取得 SOTA 表現(xiàn),在真實編程場景的使用體感逼近 Claude Opus 4.5,擅長復(fù)雜系統(tǒng)工程與長程 Agent 任務(wù)。

      目前,這款新模型已在智譜官網(wǎng)上線,并在 GitHub 和 Hugging Face 平臺開源,模型權(quán)重遵循 MIT License。

      GitHub:https://github.com/zai-org/GLM-5

      Hugging Face:https://huggingface.co/zai-org/GLM-5

      OpenRouter:http://openrouter.ai/z-ai/glm-5

      值得一提的是,智譜在官宣帖中特意注明“GLM-5 在 OpenRouter 上的前稱是 Pony Alpha”。就在幾天前,全球模型服務(wù)平臺 OpenRouter 上一款代號為“Pony Alpha”的神秘模型,因卓越性能和一系列令人驚艷的實測表現(xiàn)走紅。當(dāng)時,該平臺合作方 Kilo Code 透露,Pony Alpha 是“某個全球?qū)嶒炇易钍軞g迎的開源模型的專項進化版”。

      之后,Pony Alpha 被眾人猜測可能是 Anthropic 的 Claude Sonnet 5、DeepSeek-V4 或者 GLM-5 的提前試水。現(xiàn)在,答案終于被“正主”揭曉。

      官宣 GLM-5 后,智譜的股價連續(xù)暴漲。截止發(fā)稿前,智譜的市值突破 1700 億港元。

      自封“系統(tǒng)架構(gòu)師”,

      性能超過 Gemini 3 Pro

      一個多月前,智譜才剛剛更新到 GLM?4.7 。據(jù)介紹,GLM-5 的參數(shù)規(guī)模是上一代 GLM-4.7 的兩倍,從 3550 億提升至 7440 億,訓(xùn)練數(shù)據(jù)量從 23 萬億增至 28.5 萬億 tokens,更大規(guī)模的預(yù)訓(xùn)練算力顯著提升了模型的通用智能水平。

      并且,該模型構(gòu)建了全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強化學(xué)習(xí)任務(wù),提升強化學(xué)習(xí)后訓(xùn)練流程效率;提出異步智能體強化學(xué)習(xí)算法,使模型能夠持續(xù)從長程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力。

      此外,GLM-5 還采用了由 DeepSeek 率先提出的全新架構(gòu) DeepSeek 稀疏注意力機制,在維持長文本效果無損的同時,大幅降低模型部署成本,旨在最大化計算效率與成本效益。

      在編程能力上,GLM-5 實現(xiàn)了對齊 Claude Opus 4.5,在業(yè)內(nèi)公認(rèn)的主流基準(zhǔn)測試中取得開源模型 SOTA。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分別獲得 77.8 和 56.2 的開源模型最高分?jǐn)?shù),性能超過 Gemini 3 Pro。


      在內(nèi)部 Claude Code 評估集合中,GLM-5 在前端、后端、長程任務(wù)等編程開發(fā)任務(wù)上顯著超越上一代的 GLM-4.7(平均增幅超過 20%),能夠以極少的人工干預(yù)自主完成 Agentic 長程規(guī)劃與執(zhí)行、后端重構(gòu)和深度調(diào)試等系統(tǒng)工程任務(wù),使用體感逼近 Opus 4.5。用智譜的話說,GLM-5 是一個“系統(tǒng)架構(gòu)師”,不僅為開發(fā)精美的 Demo 而生,更為穩(wěn)定交付生產(chǎn)結(jié)果而生。


      在 Agent 能力上,GLM-5 實現(xiàn)開源 SOTA,在多個評測基準(zhǔn)中取得開源第一,在 BrowseComp(聯(lián)網(wǎng)檢索與信息理解)、MCP-Atlas(大規(guī)模端到端工具調(diào)用)和 τ2-Bench(復(fù)雜場景下自動代理的工具規(guī)劃和執(zhí)行)均取得最高表現(xiàn)。在衡量模型經(jīng)營能力的 Vending Bench 2 中,GLM-5 獲得開源模型第一表現(xiàn)。Vending Bench 2 要求模型在一年期內(nèi)經(jīng)營一個模擬的自動售貨機業(yè)務(wù),GLM-5 最終賬戶余額達到 4432 美元,經(jīng)營表現(xiàn)接近 Claude Opus 4.5。


      不過,該公司自行公布的分?jǐn)?shù)也顯示,在各項代碼基準(zhǔn)測試中,這款模型仍全面落后于 Anthropic 的 Claude。

      “價格簡直離譜”,

      實測被評最優(yōu)秀開源模型之一

      此前,在 OpenRouter 匿名上線時,就有許多開發(fā)者使用 GLM-5 完成了真正能用、能玩、能上線的應(yīng)用,例如橫版解謎游戲、Agent 交互世界、論文版“抖音”等應(yīng)用。如今公開推出后,又迎來一波開發(fā)者的積極試用。

      “GLM-5 現(xiàn)在已經(jīng)能和 Opus 4.6 同臺競技了。”一位開發(fā)者表示,“我一整個上午都在編程任務(wù)和游戲環(huán)境里折騰 GLM-5。整體來說,它在某些任務(wù)上執(zhí)行得很快,表現(xiàn)不錯,但碰到更復(fù)雜的場景,對我而言 Claude 依然是王者。”

      另一位開發(fā)者則稱,GLM-5 表現(xiàn)得很完美,絕對是目前發(fā)布的最優(yōu)秀開源模型之一。“我在 Ollama 命令行和 Claude Code 里都跑了一遍。我發(fā)現(xiàn) Claude Code 里有個缺陷,但找到了臨時解決辦法。我的 GLM-5 對話會話達到了和 Opus 4.6 同一水準(zhǔn)的自我認(rèn)知 / 理解深度。”


      還有開發(fā)者評價道,“GLM-5 可能真的是我第一次在前端任務(wù)上更傾向于選擇非 Gemini 模型。”


      “價格簡直離譜”,有開發(fā)者算完后表示,GLM5 的輸入成本比 Opus 便宜 6 倍,輸出成本便宜 10 倍。


      依托國產(chǎn)芯片,

      “把每一塊芯片用到極限”

      值得注意的是,智譜在發(fā)布公告中表示,GLM-5 可基于一批中國半導(dǎo)體企業(yè)的國產(chǎn)芯片部署,包括華為、摩爾線程、寒武紀(jì)、百度昆侖芯、沐曦集成電路、燧原科技及海光信息。而本次 GLM-5 的上線,也是依托眾多國產(chǎn)芯片有力保障了線上服務(wù)的穩(wěn)定和高效。

      去年年初,智譜被美國列入實體清單。近幾個月來,智譜已宣布致力于在純國產(chǎn)硬件體系上研發(fā)前沿大模型。不過,受限于算力資源,智譜也被迫限制其旗艦產(chǎn)品在國際市場的應(yīng)用。這一情況在 GLM-5 上仍在延續(xù)。

      “算力非常緊張。即便在 GLM?5 發(fā)布前,我們?yōu)榱酥瓮评矸?wù),已經(jīng)把每一塊芯片都用到極限。”智譜表示,因 “算力容量有限”,將逐步向代碼訂閱用戶開放 GLM?5,并提醒用戶,使用新模型可能會更快耗盡使用額度。

      智譜也宣布,基于實際使用情況與資源投入變化對 GLM Coding Plan 套餐價格體系進行結(jié)構(gòu)性調(diào)整,包括:取消首購優(yōu)惠,保留按季按年訂閱優(yōu)惠;套餐價格進行結(jié)構(gòu)性調(diào)整,整體漲幅自 30% 起;已訂閱用戶價格保持不變。

      當(dāng)前,中國幾乎所有前沿大模型開發(fā)者都在農(nóng)歷新年前密集發(fā)布重磅產(chǎn)品,復(fù)刻了去年 DeepSeek 借此一舉成名全球的打法。同樣在香港上市的 MiniMax,也在昨天官宣了其重磅新模型 M2.5,并已在官網(wǎng)開放試用。

      與此同時,DeepSeek 剛剛對其模型進行小幅升級,將對話上下文窗口擴展至 100 萬 tokens 以上,其備受期待的全新旗艦?zāi)P蜕形窗l(fā)布。讓我們拭目以待。

      https://z.ai/blog/glm-5

      聲明:本文為 AI 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。

      會議推薦

      InfoQ 2026 全年會議規(guī)劃已上線!從 AI Infra 到 Agentic AI,從 AI 工程化到產(chǎn)業(yè)落地,從技術(shù)前沿到行業(yè)應(yīng)用,全面覆蓋 AI 與軟件開發(fā)核心賽道!集結(jié)全球技術(shù)先鋒,拆解真實生產(chǎn)案例、深挖技術(shù)與產(chǎn)業(yè)落地痛點,探索前沿領(lǐng)域、聚焦產(chǎn)業(yè)賦能,獲取實戰(zhàn)落地方案與前瞻產(chǎn)業(yè)洞察,高效實現(xiàn)技術(shù)價值轉(zhuǎn)化。把握行業(yè)變革關(guān)鍵節(jié)點,搶占 2026 智能升級發(fā)展先機!

      今日薦文

      你也「在看」嗎?

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      洛克希德·馬丁的生產(chǎn)線突然停了,中國凍結(jié)了他們在華的全部資產(chǎn)

      洛克希德·馬丁的生產(chǎn)線突然停了,中國凍結(jié)了他們在華的全部資產(chǎn)

      百態(tài)人間
      2026-02-25 15:33:21
      各取所需!春節(jié)期間,張柏芝和謝霆鋒聯(lián)手,給王菲上了一課

      各取所需!春節(jié)期間,張柏芝和謝霆鋒聯(lián)手,給王菲上了一課

      妙知
      2026-03-03 14:34:08
      “天眼”24小時掃描中東,美軍在中國衛(wèi)星面前,沒有任何秘密可言

      “天眼”24小時掃描中東,美軍在中國衛(wèi)星面前,沒有任何秘密可言

      我心縱橫天地間
      2026-03-02 14:05:07
      越來越多國家被卷入中東沖突,局勢正顯露出脫軌跡象:是否會由“脈沖式打擊”轉(zhuǎn)為“持續(xù)性對峙”?

      越來越多國家被卷入中東沖突,局勢正顯露出脫軌跡象:是否會由“脈沖式打擊”轉(zhuǎn)為“持續(xù)性對峙”?

      大象新聞
      2026-03-03 13:47:02
      伊朗殺瘋了:美國多項損失數(shù)據(jù)曝光!特朗普承認(rèn):死亡人數(shù)會更多

      伊朗殺瘋了:美國多項損失數(shù)據(jù)曝光!特朗普承認(rèn):死亡人數(shù)會更多

      混沌錄
      2026-03-03 21:38:07
      手機,正在毀掉中國老人

      手機,正在毀掉中國老人

      LULU生活家
      2026-02-23 18:02:03
      特朗普稱不擔(dān)心美國基地甚至美國領(lǐng)土遭受襲擊威脅,并稱“這是戰(zhàn)爭的一部分”;美國國會將就限制總統(tǒng)戰(zhàn)爭權(quán)力議案舉行投票

      特朗普稱不擔(dān)心美國基地甚至美國領(lǐng)土遭受襲擊威脅,并稱“這是戰(zhàn)爭的一部分”;美國國會將就限制總統(tǒng)戰(zhàn)爭權(quán)力議案舉行投票

      大風(fēng)新聞
      2026-03-03 13:49:03
      拍了一年馬屁,英國終于嘴硬了一下:美國非法

      拍了一年馬屁,英國終于嘴硬了一下:美國非法

      觀察者網(wǎng)
      2026-03-03 14:54:04
      在剛剛,19家公司出現(xiàn)重大利好消息,看看有沒有與你相關(guān)的個股?

      在剛剛,19家公司出現(xiàn)重大利好消息,看看有沒有與你相關(guān)的個股?

      股市皆大事
      2026-03-03 08:05:18
      國內(nèi)8美元,國際850美元!106倍差價背后,是中國在下一盤大棋

      國內(nèi)8美元,國際850美元!106倍差價背后,是中國在下一盤大棋

      涵豆說娛
      2026-03-03 15:00:20
      8年謎團終破!張柏芝三胎生父線索曝光,最大贏家是被冤的謝霆鋒

      8年謎團終破!張柏芝三胎生父線索曝光,最大贏家是被冤的謝霆鋒

      秋姐居
      2026-03-03 17:48:27
      富商馬清鏗67歲生日,情婦高調(diào)慶生,兩人5年生4子女,原配很沉默

      富商馬清鏗67歲生日,情婦高調(diào)慶生,兩人5年生4子女,原配很沉默

      嫹筆牂牂
      2026-03-03 07:10:52
      銀行內(nèi)部實話:存款達這個金額,會被系統(tǒng)盯上

      銀行內(nèi)部實話:存款達這個金額,會被系統(tǒng)盯上

      小陸搞笑日常
      2026-02-10 03:30:26
      法官問為何不交物業(yè)費,業(yè)主反問:不交稅違法,不交費違法嗎

      法官問為何不交物業(yè)費,業(yè)主反問:不交稅違法,不交費違法嗎

      蜉蝣說
      2026-02-03 16:31:54
      “時尚果然是個輪回啊!”四季青今年第一批春裝,最流行的是這些款式

      “時尚果然是個輪回啊!”四季青今年第一批春裝,最流行的是這些款式

      都市快報橙柿互動
      2026-03-03 20:21:52
      阿布扎比再遭襲擊,阿聯(lián)酋發(fā)布全國緊急警報

      阿布扎比再遭襲擊,阿聯(lián)酋發(fā)布全國緊急警報

      極目新聞
      2026-03-03 07:31:26
      迪麗熱巴被曝滯留迪拜,工作室發(fā)文:因不可抗力,確定無法抵達巴黎,不得不缺席時裝周

      迪麗熱巴被曝滯留迪拜,工作室發(fā)文:因不可抗力,確定無法抵達巴黎,不得不缺席時裝周

      極目新聞
      2026-03-03 15:04:10
      汪小菲和張?zhí)m矛盾升級!張?zhí)m哭完不敢對鏡頭,大S當(dāng)年真沒說錯他

      汪小菲和張?zhí)m矛盾升級!張?zhí)m哭完不敢對鏡頭,大S當(dāng)年真沒說錯他

      夏末moent
      2026-03-02 08:43:40
      這一次,伊朗領(lǐng)導(dǎo)人的慘痛遭遇,再一次印證了毛主席的高瞻遠矚

      這一次,伊朗領(lǐng)導(dǎo)人的慘痛遭遇,再一次印證了毛主席的高瞻遠矚

      夢史
      2026-03-02 11:21:33
      一位馬來西亞人稱:如果中國真的開戰(zhàn),我要向中國報名加入戰(zhàn)爭!

      一位馬來西亞人稱:如果中國真的開戰(zhàn),我要向中國報名加入戰(zhàn)爭!

      南權(quán)先生
      2026-02-11 15:56:36
      2026-03-03 22:07:00
      AI前線 incentive-icons
      AI前線
      面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
      1335文章數(shù) 132關(guān)注度
      往期回顧 全部

      科技要聞

      擁抱AI的"牛馬":邊提效邊自嘲"自費"上班

      頭條要聞

      美以伊沖突進入第四日:以軍地面部隊"下場"

      頭條要聞

      美以伊沖突進入第四日:以軍地面部隊"下場"

      體育要聞

      35輪后積分-7,他們遭遇史上最早的降級

      娛樂要聞

      謝娜霸氣護夫:喊話薛之謙給張杰道歉

      財經(jīng)要聞

      特朗普“不惜一切”!全球股債齊崩

      汽車要聞

      第一梯隊輔助駕駛加持 iCAR V27定檔3月13日上市

      態(tài)度原創(chuàng)

      游戲
      親子
      教育
      家居
      數(shù)碼

      LPL季后賽:全員打出對位差距,AL碾壓式戰(zhàn)勝IG,拿下勝利

      親子要聞

      大型寒假作業(yè)趕工現(xiàn)場,萌娃搞笑日常

      教育要聞

      剛剛!第一批院校復(fù)試線公布了!

      家居要聞

      萬物互聯(lián) 享科技福祉

      數(shù)碼要聞

      泰坦軍團新品顯示器預(yù)約,275Hz 2K屏僅1110元!

      無障礙瀏覽 進入關(guān)懷版