<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      智譜最強模型發(fā)布!編程對齊Claude Opus 4.5,七家國產(chǎn)芯片已火速適配

      0
      分享至


      智東西
      作者 陳駿達
      編輯 李水青

      破案了,前兩天在開發(fā)者社區(qū)爆火的“Pony Alpha”,就是智譜的GLM-5!

      智東西2月12日報道,今天,智譜發(fā)布了其最新一代基礎(chǔ)模型GLM-5,這是一個擁有744B參數(shù)(40B激活)的模型,為GLM-4.5的兩倍多。在Artificial Analysis榜單中,GLM-5位居全球第四、開源第一

      GLM-5的預(yù)訓(xùn)練數(shù)據(jù)從23T提升至28.5T。智譜在技術(shù)報告中寫道:“Scaling(規(guī)模化)仍然是提高AGI智能效率的最重要方式之一。”


      智譜稱,GLM-5在編程能力上實現(xiàn)了對Claude Opus 4.5的對齊,在主流基準(zhǔn)測試中取得開源模型SOTA分?jǐn)?shù)。在SWE-bench-Verified和Terminal Bench 2.0中,GLM-5分別獲得77.8和56.2的開源模型SOTA分?jǐn)?shù),性能超過Gemini 3 Pro。


      架構(gòu)方面,GLM-5集成了DeepSeek的DSA稀疏注意力架構(gòu),能降低部署成本,同時保證了上下文容量。

      在新模型發(fā)布后,智譜的股價今天已經(jīng)上漲了26%。本周,智譜股價累計上漲約70%,市值目前已經(jīng)達到1756.62億港幣(約合人民幣1551.62億元)。


      GLM-5上線后,我們第一時間給它出了幾道帶有邏輯陷阱的的網(wǎng)紅測試題。第一道題目是這樣的:我要去洗車,洗車的地方離家就100米,我是開車去呢,還是走著去呢?

      不少主流大模型其實都會在這道題目上“翻車”,不過GLM-5一眼就看穿了里頭的陷阱。它分析道,肯定得開車去,因為洗的是車而不是人。最后,它還提出一個天才方案,可以先開車去,然后走回家休息,洗完了再去取車,這樣就不用在旁邊干等著吸尾氣了。


      緊接著我們嘗試了另一個問題:父親和母親可以結(jié)婚嗎?在這道題目上,由于我們的問題中給的限定不多,GLM-5拆解出了更為具體的兩種情況,分析內(nèi)容合理,還知道這題目里也藏著邏輯誤區(qū)——父母通常情況下就是夫妻關(guān)系,所以他們不僅是可以結(jié)婚,而是已經(jīng)結(jié)婚的狀態(tài)。


      我們最后又試著問了它這個問題:“今年才知道,親生父母結(jié)婚時候沒有叫我,我很難過怎么辦?”收到消息后,GLM-5就好像馬上切換到了心理咨詢模式,貼心地安慰起用戶,徹底繞進了題目里的陷阱——親生父母結(jié)婚的時候,孩子大概率還沒出生呢。


      也有不少網(wǎng)友上手體驗了GLM-5。比如,這位網(wǎng)友就讓自己的OpenClaw Agent用不同模型進行了一次SwiftUI編程測試,GLM-5的表現(xiàn)要優(yōu)于Minimax M2.1。


      還有一位網(wǎng)友讓GLM-5、GLM4.7和Opus 4.6進行了3D網(wǎng)頁的開發(fā),這位網(wǎng)友認(rèn)為GLM-5的升級很大,與Opus 4.6有一些品味方面的差異。


      在博客中,智譜稱,GLM-5的上線得到眾多國產(chǎn)芯片保障,GLM-5已完成與華為昇騰、摩爾線程、寒武紀(jì)、昆侖芯、沐曦、燧原、海光等國產(chǎn)算力平臺的深度推理適配。通過底層算子優(yōu)化與硬件加速,GLM-5在國產(chǎn)芯片集群上已經(jīng)實現(xiàn)高吞吐、低延遲的穩(wěn)定運行。


      面向開發(fā)者群體,智譜的模型一般以GLM Coding Plan的方式對外提供服務(wù)。不過由于使用量快速提升,為保障服務(wù)質(zhì)量,智譜決定調(diào)整套餐價格,整體漲幅自30%起。

      GLM-5已在Hugging Face和魔搭社區(qū)上開源,模型權(quán)重以MIT許可證發(fā)布。GLM-5也支持開發(fā)者平臺api.z.ai和BigModel.cn,兼容Claude Code和OpenClaw。普通用戶也可以在Z.ai免費試用。

      開源鏈接:

      https://huggingface.co/zai-org/GLM-5

      API調(diào)用:

      https://bigmodel.cn/

      一、性能較GLM-4.7平均增幅超過20%,Z Code智能體開發(fā)環(huán)境發(fā)布

      在博客中,智譜提到,大模型正從寫代碼、寫前端,進化到寫工程、完成大任務(wù),即從“Vibe Coding”變革為“Agentic Engineering”。

      智譜內(nèi)部的內(nèi)部Claude Code評估結(jié)果顯示,GLM-5在前端、后端、長程任務(wù)等編程開發(fā)任務(wù)上超越GLM-4.7(平均增幅超過20%),能自主完成Agentic長程規(guī)劃與執(zhí)行、后端重構(gòu)和深度調(diào)試等系統(tǒng)工程任務(wù),使用體感逼近Opus 4.5。

      此前,我們已在OpenRouter上測試了以“Pony Alpha”這一馬甲現(xiàn)身的GLM-5。這一模型在復(fù)雜編程領(lǐng)域的表現(xiàn)確實有明顯可感的提升。

      比如,我們曾試著讓GLM-5復(fù)刻知名游戲《星露谷物語》。拿到提示詞后,模型會像項目經(jīng)理一樣,分析了我們提示詞中的核心需求,梳理出需要設(shè)計的八大系統(tǒng)與配色方案,以指導(dǎo)后期的開發(fā)。

      之后,模型還會像架構(gòu)師一樣規(guī)劃項目的整體架構(gòu),并打造出一個初步可玩的游戲界面。


      當(dāng)我們提出“進一步豐富游戲”這樣的模糊需求時,GLM可以自行規(guī)劃,并打造出完成度更高的游戲。

      也有開發(fā)者用GLM-5打造了橫版解謎游戲、Agent交互世界、論文版“抖音”等應(yīng)用。這些應(yīng)用有些已經(jīng)開放下載,有些則提交應(yīng)用商店審核。

      面向編程場景,智譜還推出了Z Code智能體開發(fā)環(huán)境。用戶只需把需求說清楚,模型會自動拆解任務(wù),多智能體并發(fā)完成代碼、跑命令、調(diào)試、預(yù)覽和提交等開發(fā)全流程。在Z Code上,用戶甚至可以用手機遠程指揮桌面端Agent。

      值得一提的是,Z Code也是全程由GLM模型參與開發(fā)的。

      二、可一鍵接入OpenClaw,還能直出Word文檔、PDF

      除了編程之外,GLM-5也可作為通用Agent助手的基座模型。

      在OpenClaw中接入GLM-5后,用戶可以讓GLM-5幫你搜索網(wǎng)站、定時整理資訊、發(fā)布推文、編程等。

      智譜已經(jīng)推出了AutoGLM版本的OpenClaw,支持官網(wǎng)一鍵完成OpenClaw與飛書機器人的一體化配置。

      GLM-5還擁有更強的復(fù)雜系統(tǒng)工程和長程智能體能力,可將文本或素材直接轉(zhuǎn)換為docx、pdf和xlsx文件。

      在Z.ai和智譜清言上,用戶可以讓GLM-5直接輸出產(chǎn)品需求文檔、教案、試卷、電子表格、財務(wù)報告、流程表、菜單等文檔。

      GLM-5在Agent能力上實現(xiàn)開源SOTA,在BrowseComp(聯(lián)網(wǎng)檢索與信息理解)、MCP-Atlas(工具調(diào)用和多步驟任務(wù)執(zhí)行)和τ2-Bench(復(fù)雜多工具場景下的規(guī)劃和執(zhí)行)中,均取得開源SOTA。


      在衡量模型經(jīng)營能力的Vending Bench 2中,GLM-5也獲得開源SOTA。Vending Bench 2要求模型在一年期內(nèi)經(jīng)營一個模擬的自動售貨機業(yè)務(wù),GLM-5最終賬戶余額達到4432美元,經(jīng)營表現(xiàn)接近Claude Opus 4.5,展現(xiàn)了不錯的長期規(guī)劃和資源管理能力。


      強化學(xué)習(xí)是提升智能體能力的重要方式。智譜在GLM-5中采用了全新的“Slime”框架,支持更大模型規(guī)模及更復(fù)雜的強化學(xué)習(xí)任務(wù),提升強化學(xué)習(xí)后訓(xùn)練流程效率。

      此外,智譜還提出了異步智能體強化學(xué)習(xí)算法,使模型能夠持續(xù)從長程交互中學(xué)習(xí),充分激發(fā)預(yù)訓(xùn)練模型的潛力。

      結(jié)語:編程模型押注工程級能力

      從“寫代碼”到“做工程”,大模型的能力邊界正在被不斷推遠。越來越多的大模型已經(jīng)不滿足于僅僅出個簡易的Demo,而是想要在長序列任務(wù)、復(fù)雜系統(tǒng)規(guī)劃與多步驟執(zhí)行上實現(xiàn)突破。

      這種能力的進化,或許會使模型不再只是開發(fā)流程中的輔助工具,而開始具備承擔(dān)完整工程環(huán)節(jié)的潛力。圍繞長程規(guī)劃、復(fù)雜推理與多智能體協(xié)作的能力提升,或?qū)⒊蔀槲磥硪欢螘r間內(nèi)編程模型升級的重點方向。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      滾出去!中國不是“撿破爛”的:日本混不下去,就想回中方撈金?

      滾出去!中國不是“撿破爛”的:日本混不下去,就想回中方撈金?

      來科點譜
      2026-02-18 07:06:28
      湯唯帶韓國老公回家拜年,機場霸氣呵斥插隊者,9歲女兒圈粉無數(shù)

      湯唯帶韓國老公回家拜年,機場霸氣呵斥插隊者,9歲女兒圈粉無數(shù)

      右右細毛和爸媽
      2026-02-21 12:00:15
      2-1!曼城翻盤在望:英超3連勝+差榜首2分,阿森納爭冠已無退路

      2-1!曼城翻盤在望:英超3連勝+差榜首2分,阿森納爭冠已無退路

      體育知多少
      2026-02-22 07:12:20
      雁蕩路上的"雙面”面館:白天是“社區(qū)食堂”,深夜變身潮流青年聚集地|新春走基層

      雁蕩路上的"雙面”面館:白天是“社區(qū)食堂”,深夜變身潮流青年聚集地|新春走基層

      上海黃浦
      2026-02-21 21:28:11
      日本將要求外國游客在入境前必須接受審查,并上調(diào)在留資格費用

      日本將要求外國游客在入境前必須接受審查,并上調(diào)在留資格費用

      東京在線
      2026-02-21 22:32:28
      一個問題:愛潑斯坦的“邪惡”從何而來?

      一個問題:愛潑斯坦的“邪惡”從何而來?

      百味朱砂
      2026-02-14 14:46:51
      舉報《太平年》的人,到底在怕什么

      舉報《太平年》的人,到底在怕什么

      勇哥讀史
      2026-02-19 10:10:16
      秦昊伊能靜沈陽逛街撒糖:煙火氣里藏著最動人的浪漫

      秦昊伊能靜沈陽逛街撒糖:煙火氣里藏著最動人的浪漫

      嘴角上翹的弧度
      2026-02-22 05:12:39
      《鏢人》最憋屈的明星,不是謝霆鋒不是吳京,而是全程未露臉的他

      《鏢人》最憋屈的明星,不是謝霆鋒不是吳京,而是全程未露臉的他

      師維
      2026-02-21 23:42:35
      56歲王菲香港中環(huán)被偶遇!素顏啃冰激凌超清爽,無濾鏡狀態(tài)絕了

      56歲王菲香港中環(huán)被偶遇!素顏啃冰激凌超清爽,無濾鏡狀態(tài)絕了

      老吳教育課堂
      2026-02-22 09:34:44
      生姜立大功?美國研究發(fā)現(xiàn):生姜可在48小時內(nèi)清除50%老化細胞?

      生姜立大功?美國研究發(fā)現(xiàn):生姜可在48小時內(nèi)清除50%老化細胞?

      39健康網(wǎng)
      2026-02-11 09:11:33
      汪東興活到了2015年,他對當(dāng)下中國有何看法?他心里確實有些成見

      汪東興活到了2015年,他對當(dāng)下中國有何看法?他心里確實有些成見

      明月清風(fēng)閣
      2026-02-19 07:25:09
      詹姆斯在湖人隊?wèi)?zhàn)勝快船后盛贊科懷·倫納德——“他是最棒的”

      詹姆斯在湖人隊?wèi)?zhàn)勝快船后盛贊科懷·倫納德——“他是最棒的”

      好火子
      2026-02-22 07:13:46
      徹底免關(guān)稅,中方官宣史無前例,53國正式站隊中方,美日無牌可打

      徹底免關(guān)稅,中方官宣史無前例,53國正式站隊中方,美日無牌可打

      兵說
      2026-02-21 12:05:21
      白宮公布特朗普訪華時間!美國三張“王牌”曝光,中美關(guān)系或有變

      白宮公布特朗普訪華時間!美國三張“王牌”曝光,中美關(guān)系或有變

      南宗歷史
      2026-02-21 16:16:25
      楊瀾:我與老公早已無愛,若繼續(xù)再在一起,對彼此都是很不公平的

      楊瀾:我與老公早已無愛,若繼續(xù)再在一起,對彼此都是很不公平的

      小徐講八卦
      2026-02-11 13:00:09
      狂刪“裸戲”,仍被禁播,此片“成人藝術(shù)”太生猛,謹(jǐn)慎觀看

      狂刪“裸戲”,仍被禁播,此片“成人藝術(shù)”太生猛,謹(jǐn)慎觀看

      棱鏡電影
      2026-02-01 19:33:19
      摔倒被扶反索賠22萬后續(xù):律師發(fā)聲,案件焦點已明,賠償跑不掉了

      摔倒被扶反索賠22萬后續(xù):律師發(fā)聲,案件焦點已明,賠償跑不掉了

      愛下廚的阿釃
      2026-02-21 06:55:42
      為了“掏空”老百姓家底,而編造出來的“4大謊言”,誰信誰倒霉

      為了“掏空”老百姓家底,而編造出來的“4大謊言”,誰信誰倒霉

      平說財經(jīng)
      2026-02-18 08:38:03
      沉默的榮耀:谷正文至死不知,真正讓黎晴背叛的不是吳石不是聶曦

      沉默的榮耀:谷正文至死不知,真正讓黎晴背叛的不是吳石不是聶曦

      陳意小可愛
      2026-02-22 10:17:22
      2026-02-22 12:19:00
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。
      11245文章數(shù) 116973關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克:星艦每年將發(fā)射超過10000顆衛(wèi)星

      頭條要聞

      特朗普:將確定并公布新的、在法律上允許的關(guān)稅措施

      頭條要聞

      特朗普:將確定并公布新的、在法律上允許的關(guān)稅措施

      體育要聞

      徐夢桃:這是我第一塊銅牌 給我換個吉祥物

      娛樂要聞

      裴世矩養(yǎng)侄為刃 看懂兩次放行裴行儼!

      財經(jīng)要聞

      特朗普新加征關(guān)稅稅率從10%提升至15%

      汽車要聞

      續(xù)航1810km!smart精靈#6 EHD超級電混2026年上市

      態(tài)度原創(chuàng)

      本地
      手機
      親子
      數(shù)碼
      房產(chǎn)

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      手機要聞

      小米最受歡迎的是哪個檔次機型,這個數(shù)據(jù)有點意思

      親子要聞

      為什么小男孩小時候要比小女孩難養(yǎng)好多?網(wǎng)友:通常精力充沛

      數(shù)碼要聞

      2026中國電影票房暫列全球第一;小米17系列進軍全球市場

      房產(chǎn)要聞

      窗前即地標(biāo)!獨占三亞灣C位 自貿(mào)港總裁行宮亮相

      無障礙瀏覽 進入關(guān)懷版