![]()
模型能力是決定長期競爭力的根本要素。
據IPO早知道消息,“全球大模型第一股”智譜(2513.HK)今日開盤上漲超25%再創歷史新高,市值突破1700億港元。
當然,這主要源于智譜今天上線并開源了被譽為“Agentic Engineering時代最好開源模型”的GLM-5——不可否認的是,學界與業界正逐漸形成一種共識,大模型從寫代碼、寫前端,進化到寫工程、完成大任務,即從"Vibe Coding"變革為 "Agentic Engineering"。
GLM-5正是這一變革的產物:在 Coding 與 Agent 能力上,GLM-5 取得開源 SOTA 表現,在編程能力上實現了對齊 Claude Opus 4.5,在業內公認的主流基準測試中取得開源模型 SOTA。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分別獲得 77.8 和 56.2 的開源模型最高分數,性能超過 Gemini 3 Pro。
正是這一能力水準,使GLM-5在未公開開發者身份的前提下迅速引發全球開發者的關注,在匿名測試期間連續多日占據 OpenRouter平臺熱門模型,并被用戶評價為“最強匿名模型”之一。
這里需要指出的一點是,長期以來,閉源模型憑借在復雜工程任務中的穩定交付能力構筑了競爭壁壘,開源模型則多定位于低成本平替。而GLM-5的發布,意味著開源陣營首次在“工程可交付性”上實現對頂尖閉源模型的追趕,為全球開發者提供了首個具備系統工程能力的開源基礎模型,改變行業格局。
另外需要注意的是,GLM系列模型一直受到全球開發者喜愛,故在GLM Coding Plan 全球爆量后,智譜不得不啟動限售活動。而本次 GLM-5 的上線依托眾多國產芯片有力保障了線上服務的穩定和高效。
![]()
目前,GLM-5 已完成與華為昇騰、摩爾線程、寒武紀、昆侖芯、沐曦、燧原、海光等國產算力平臺的深度推理適配。通過底層算子優化與硬件加速,GLM-5 在國產芯片集群上已經實現高吞吐、低延遲的穩定運行。
模型能力是決定長期競爭力的根本要素
智譜是具備顯著潛能的技術能力驅動型平臺
本周摩根大通發布的研報指出,中國 AI 市場正從“百模大戰”過渡至結構性整合階段,能否生存取決于商業化落地能力與可持續的模型迭代。在此階段,摩根大通認為模型能力是決定長期競爭力的根本要素。
此外,摩根大通還強調,AI模型開發商的長期經濟效益,主要取決于其能否在多輪技術周期中保持模型能力處于全球領先位置,而商業模式形態、部署方式及短期利潤率結構,很大程度上是該能力衍生出的下游表現。“智譜已展現出堅實的技術實力,只要能將其自研模型的性能保持在全球頂尖梯隊,那么對AI能力需求的巨大規模,疊加中國獨特的工程成本優勢,將支撐公司營收走出強勁增長軌跡。”
而從GLM系列模型的持續發布,以及智譜的戰略明顯向智能體系統、工具增強推理與面向開發者的基礎設施傾斜,均在一定程度上表明智譜的技術路線圖正與全球前沿技術能力維度對齊。
基于這一邏輯,摩根大通將智譜定義為一個具備顯著增長潛能的技術能力驅動型平臺。從商業化路徑來看,智譜可規模化擴張的云 API 業務以及正在加速推進的全球開發者生態落地,都已成為其增長的重要驅動力。
摩根大通預計,得益于通過全球開發者生態落地快速推進 API 業務的規模化擴張, 2025-2030年智譜營收年復合增長率為127%,并將于2029年實現盈利,目標價較當前股價仍有較大漲幅空間,是把握全球AI下一輪價值創造浪潮的首選標的。
性能直接對標Claude Opus 4.5
要做真正的 Agentic Ready 基座模型
回到智譜本次發布的新模型本身。
GLM-5 在編程能力上實現了對齊 Claude Opus 4.5,在業內公認的主流基準測試中取得開源模型 SOTA。在 SWE-bench-Verified 和 Terminal Bench 2.0 中分別獲得 77.8 和 56.2 的開源模型最高分數,性能超過 Gemini 3 Pro。
![]()
事實上,2026年大模型將會從“會寫”走到“會做事”,尤其是端到端完成大型任務。GLM-5 是一個“系統架構師”,它不僅為開發精美的 Demo 而生,更為穩定交付生產結果而生。
在內部 Claude Code 評估集合中,GLM-5 在前端、后端、長程任務等編程開發任務上顯著超越上一代的 GLM-4.7(平均增幅超過20%),能夠以極少的人工干預自主完成 Agentic 長程規劃與執行、后端重構和深度調試等系統工程任務,使用體感逼近 Opus 4.5。
![]()
此外,GLM-5 在 Agent 能力上同樣實現開源 SOTA,在多個評測基準中取得開源第一。在 BrowseComp(聯網檢索與信息理解)、MCP-Atlas(大規模端到端工具調用)和 τ2-Bench(復雜場景下自動代理的工具規劃和執行)均取得最高表現。
![]()
在衡量模型經營能力的 Vending Bench 2 中,GLM-5 獲得開源模型第一表現。Vending Bench 2 要求模型在一年期內經營一個模擬的自動售貨機業務,GLM-5 最終賬戶余額達到 4432 美元,經營表現接近 Claude Opus 4.5,展現出出色的長期規劃和資源管理能力。
![]()
整體而言,這些能力是 Agentic Engineering 的核心:模型不僅要能寫代碼、完成工程,還要能在長程任務中保持目標一致性、進行資源管理、處理多步驟依賴關系,成為真正的 Agentic Ready 基座模型。
本文為IPO早知道原創
作者|Stone Jin
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.