“AI大牛股”公開(kāi)技術(shù)細(xì)節(jié)。
今日下午,“全球大模型第一股”智譜正式發(fā)布了GLM-5技術(shù)報(bào)告。智譜表示,GLM-5能夠?qū)崿F(xiàn)性能的大幅躍升,主要得益于四大技術(shù)創(chuàng)新。GLM-5在真實(shí)世界編程任務(wù)中展現(xiàn)出前所未有的能力,在處理端到端軟件工程挑戰(zhàn)方面超越了此前所有開(kāi)源基線。
股價(jià)表現(xiàn)方面,周五(2月20日),智譜股價(jià)單日大漲42.72%,報(bào)725港元/股,股價(jià)再創(chuàng)新高,總市值達(dá)3232億港元,上市43天股價(jià)累計(jì)漲幅已超500%。消息面上,在發(fā)布GLM-5后,由于供不應(yīng)求,智譜宣布上調(diào)GLM Coding Plan套餐價(jià)格,中國(guó)區(qū)漲價(jià)30%,海外版漲價(jià)超100%。
智譜最新發(fā)布
2月22日下午,據(jù)智譜官微消息,智譜推出了GLM-5,這是一款旨在推動(dòng)編程范式從“VibeCoding”(氛圍編程)轉(zhuǎn)向“AgenticEngineering”(智能體工程)的下一代基礎(chǔ)模型。GLM-5在前代模型GLM-4.5的智能體、推理與編程(Agentic,ReasoningandCoding,ARC)能力基礎(chǔ)上,采用稀疏注意力(DeepSeekSparseAttention,DSA)以大幅降低推理成本,同時(shí)保持長(zhǎng)上下文能力無(wú)損。
為了讓模型更好地與各類(lèi)任務(wù)對(duì)齊,智譜構(gòu)建了一套新型異步強(qiáng)化學(xué)習(xí)(RL)基礎(chǔ)設(shè)施,通過(guò)將生成過(guò)程與訓(xùn)練過(guò)程解耦,從而大幅提升了后訓(xùn)練的迭代效率。此外,智譜還提出了全新的異步Agent強(qiáng)化學(xué)習(xí)算法,進(jìn)一步提升強(qiáng)化學(xué)習(xí)的效果,使模型能夠更有效地從復(fù)雜、長(zhǎng)程交互中學(xué)習(xí)。
智譜稱(chēng),基于上述創(chuàng)新,GLM-5在主流的開(kāi)放基準(zhǔn)測(cè)試中實(shí)現(xiàn)了SOTA性能。最關(guān)鍵的是,GLM-5在真實(shí)世界編程任務(wù)中展現(xiàn)出前所未有的能力,在處理端到端軟件工程挑戰(zhàn)方面超越了此前所有開(kāi)源基線。
智譜指出,GLM-5在性能與計(jì)算效率上實(shí)現(xiàn)了躍升,不僅在ArtificialAnalysis.ai、LMArena文本與代碼等主要榜單中均達(dá)到SOTA水平,更重塑了真實(shí)世界的編程標(biāo)準(zhǔn)。它突破了SWE-bench等傳統(tǒng)靜態(tài)測(cè)評(píng)的考察邊界,在處理復(fù)雜的端到端軟件開(kāi)發(fā)任務(wù)時(shí),展現(xiàn)出了前所未有的強(qiáng)大能力。
四大技術(shù)創(chuàng)新
據(jù)GLM-5技術(shù)報(bào)告,GLM-5能夠?qū)崿F(xiàn)性能的大幅躍升,主要得益于以下四大技術(shù)創(chuàng)新:
第一,引入DSA稀疏注意力機(jī)制(DeepSeekSparseAttention,DSA)。這一全新架構(gòu)極大降低了訓(xùn)練與推理成本。此前的GLM-4.5依賴(lài)標(biāo)準(zhǔn)MoE架構(gòu)提升效率,而DSA機(jī)制則使GLM-5能夠根據(jù)Token的重要性動(dòng)態(tài)分配注意力資源。在不折損長(zhǎng)上下文理解和推理深度的前提下,算力開(kāi)銷(xiāo)得以大幅削減。得益于此,"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"para",{"tagName":"p","attributes":{},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"font-size:15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">智譜將模型參數(shù)規(guī)模成功擴(kuò)展至744B(7440億),同時(shí)將訓(xùn)練Token規(guī)模提升至28.5T(28.5萬(wàn)億)。
第二,構(gòu)建全新的異步RL基礎(chǔ)設(shè)施。基于GLM-4.5時(shí)期slime框架“訓(xùn)練與推理解耦”的設(shè)計(jì),"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"para",{"tagName":"p","attributes":{},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"font-size:15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">智譜的新基建進(jìn)一步實(shí)現(xiàn)了“生成與訓(xùn)練”的深度解耦,將GPU利用率推向極致。該系統(tǒng)支持模型開(kāi)展大規(guī)模的智能體(Agent)軌跡探索,大幅減緩了以往拖慢迭代速度的同步瓶頸,讓RL后訓(xùn)練流程的效率實(shí)現(xiàn)了質(zhì)的飛躍。
第三,提出全新的異步AgentRL算法。該算法旨在全面提升模型的自主決策質(zhì)量。GLM-4.5曾依靠迭代自蒸餾和結(jié)果監(jiān)督來(lái)訓(xùn)練Agent;而在GLM-5中,"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"para",{"tagName":"p","attributes":{},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"font-size:15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">智譜研發(fā)的異步算法使模型能夠從多樣化的長(zhǎng)周期交互中持續(xù)學(xué)習(xí)。這一算法針對(duì)動(dòng)態(tài)環(huán)境下的規(guī)劃與自我糾錯(cuò)能力進(jìn)行了深度優(yōu)化,這也正是GLM-5能夠在真實(shí)編程場(chǎng)景中表現(xiàn)卓越的底層邏輯。
第四,全面擁抱國(guó)產(chǎn)算力生態(tài)。從模型發(fā)布伊始,GLM-5就原生適配了中國(guó)GPU生態(tài)。"},"namespaceURI":"http://www.w3.org/1999/xhtml"},"para",{"tagName":"p","attributes":{},"namespaceURI":"http://www.w3.org/1999/xhtml"},"node",{"tagName":"span","attributes":{"style":"font-size:15px;"},"namespaceURI":"http://www.w3.org/1999/xhtml"}]">智譜已完成從底層內(nèi)核到上層推理框架的深度優(yōu)化,全面兼容七大主流國(guó)產(chǎn)芯片平臺(tái):華為昇騰、摩爾線程、海光、寒武紀(jì)、昆侖芯、天數(shù)智芯與燧原。
智譜表示,“憑借上述進(jìn)步,GLM-5不僅是一個(gè)更強(qiáng)大的模型,更是下一代AI Agent 更高效、更實(shí)用的基礎(chǔ)模型。我們向社區(qū)開(kāi)源GLM-5,以進(jìn)一步推動(dòng)高效的、面向 Agent 的通用人工智能的發(fā)展。”
智譜致歉
昨日(2月21日)晚間,智譜在“智譜開(kāi)放平臺(tái)”微信公眾號(hào)發(fā)布GLM Coding Plan致歉信,并公布處理和補(bǔ)償方案。
智譜稱(chēng),這次改版主要犯了三個(gè)錯(cuò):規(guī)則透明度不夠、GLM-5灰度節(jié)奏太慢、老用戶(hù)升級(jí)機(jī)制設(shè)計(jì)粗糙。
GLM Coding Plan是智譜專(zhuān)門(mén)為AI編程場(chǎng)景推出的付費(fèi)訂閱套餐服務(wù),開(kāi)發(fā)者訂閱后,可以使用智譜提供的大模型來(lái)輔助寫(xiě)代碼。套餐等級(jí)通常分為L(zhǎng)ite、Pro、Max三個(gè)等級(jí),對(duì)應(yīng)不同的使用額度和模型權(quán)限。
據(jù)了解,GLM Coding Plan上線即售罄,國(guó)產(chǎn)AI編程模型的付費(fèi)套餐被搶空,在行業(yè)中頗為罕見(jiàn)。
需求火爆導(dǎo)致GLM Coding Plan的用戶(hù)體驗(yàn)受到影響。在致歉信中,智譜解釋稱(chēng),其近期遭受灰產(chǎn)號(hào)池和黃牛黨沖擊,惡意占用了公司大量資源。同時(shí),GLM-5發(fā)布后,流量超出預(yù)期,公司擴(kuò)容節(jié)奏沒(méi)有跟上,不得已將GLM-5按照Max、Pro、Lite的順序逐步開(kāi)放。
目前Max用戶(hù)已經(jīng)全面開(kāi)放,Pro用戶(hù)雖已開(kāi)放,但高峰期可能會(huì)因集群負(fù)載較高遇到限流,Lite用戶(hù)將會(huì)在節(jié)后非高峰期逐步灰度開(kāi)放。
針對(duì)受到影響的Lite和Pro用戶(hù),智譜支持自主申請(qǐng)退款。
此前在2月12日,智譜發(fā)布新一代旗艦?zāi)P虶LM-5,并在海外走紅。在Coding與Agent能力上,GLM-5取得開(kāi)源SOTA表現(xiàn),在真實(shí)編程場(chǎng)景的使用體感逼近Claude Opus4.5,擅長(zhǎng)復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)。
在發(fā)布GLM-5后,由于供不應(yīng)求,智譜宣布上調(diào)GLM Coding Plan套餐價(jià)格,中國(guó)區(qū)漲價(jià)30%,海外版漲價(jià)超100%,成為國(guó)內(nèi)首家對(duì)大模型商業(yè)化服務(wù)進(jìn)行提價(jià)的AI原生企業(yè)。
責(zé)編:楊喻程
排版:汪云鵬
校對(duì):蘇煥文
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.