<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      智譜GLM-5和Seedance 2.0,我愿看作國產大模型的雙子星

      0
      分享至

      1月初,智譜在香港IPO以后,股價勢頭一直不錯;這兩天又創新高,已經超過了MiniMax和一眾互聯網巨頭。

      這段時間高頻使用了最新發的GLM-5,我突然覺得,不管是民間、海外還是資本市場,對智譜的能力甚至有點低估。

      字節的Seedance 2.0視頻模型最近也很出圈,和智譜的GLM-5,一起構成了國產模型領域的雙子星。

      都是在海外能掀起狂風巨浪的程度。



      看這個馬,是不是有點熟悉?

      沒錯,就是前段時間在OpenRouter,被猜是Claude Sonnet 5或者是DeepSeek V5的Pony Alpha,答案終于揭曉,就是智譜新開源GLM-5。

      紙面上的數據實力非常強勁,完全是臨近馬年殺出去的一匹黑馬。


      在我看來,智譜GLM-5和GPT-5.3、Claude Opus-4.5一起,站在了世界范圍內綜合能力的第一梯隊。

      看官方的說法是,GLM-5 標志著人工智能開發從“Vibe Coding”變革為“Agentic Engineering”,更大規模的 AI 自動化編程,其代碼能力實現跨越式提升。


      各種測試也顯示,在代碼能力、智能體表現等的評分中取得SOTA表現,在真實編程場景的使用體感,逼近 Claude Opus-4.5,擅長復雜系統工程與長程 Agent 任務。

      到底怎么樣,帶大家一起試一試。

      z.ai 官網,直接上手!

      01.從前端到后端,GLM-5文體兩開花


      目前,這款新模型已在智譜官網上線,并在 GitHub 和 Hugging Face 平臺開源,模型權重遵循 MIT License。

      GitHub:https://github.com/zai-org/GLM-5

      Hugging Face:https://huggingface.co/zai-org/GLM-5

      OpenRouter:http://openrouter.ai/z-ai/glm-5

      不得不說,這樣強的開源模型絕對是開發者的利好,我們自己公司今年已經囤了不少token了。

      布置任務,看GLM-5自己去執行,不得不說很有成就感。


      我給出的任務是:「做一個OPC一人公司互動平臺,可以實現自動接單商業閉環承接任務,每個人可以有多個智能體員工」。

      受OpenClaw啟發,我希望有多Agent幫我實現在線接單,能夠在商業上完成閉環,一個人就是一家公司。


      看效果,功能實現很齊全,幫我設計了工作臺、智能體等多個板塊,在任務市場當中還可以Agent自動接單完成任務。


      接著就Muti-Agent來說,之前的代碼能力和任務完成度,即便是頂尖的開源模型,在處理復雜環境多節點的任務時,往往和最好的閉源模型還有差距。

      比如說AI Town斯坦福小鎮的概念,我嘗試過用各家模型來復刻,說實話效果都不好。

      GLM-5可以說是建立了新的Benchmark。


      我比較喜歡籃球,于是定制了一個本土化的籃球巨星小鎮,喜歡籃球的朋友可以在小鎮上互動、打球、比賽,還可以聊八卦。


      按照時間線,從第一天開始,每位球星的積分還能增加。

      具體到對應的管線設計和行動流程,通過對話的方式還可以實現修改。

      我也有嘗試,把GLM-5接入到一個自動化 Agent 框架中,讓它完成從克隆項目、配置環境、安裝依賴、運行到修復錯誤的完整流程。

      這個測試的重點,想看看能不能在多次失敗之后繼續推進。

      結果非常清楚。

      GLM-5 并不會因為一次失敗就停下來,它會重新審視目標,調用工具,調整命令,再次嘗試。

      終端里不斷刷新的日志,和對話框中持續推進的規劃,讓整個過程看起來像一場緩慢但堅定的推進。

      比如讓給我做一個3D游戲,也能反復調用和調整,直到最終達成目標。



      結果來看,完成的游戲界面和互動效果,都很不錯。

      一直覺得,Agent 真正的瓶頸,從來不在于工具層,而在于基礎模型是否足夠穩定、足夠自洽。

      過去很多 Agent 框架容易卡死,本質原因在于模型在長時間任務中丟失上下文,或者在失敗后無法重建目標。

      GLM-5 在這一點上,已經達到了可以實際使用的水平。

      3D交互的質感也很細膩:


      除了前端交互性質的嘗試,我還試了一下后端任務。

      我給它的任務非常直接,構建一個帶鑒權、緩存策略、異步隊列的后端服務原型,并要求它在本地環境中跑通,能夠通過基礎壓力測試。


      這個任務本身并不新鮮,真正關鍵的是過程。

      GLM-5 在一開始并沒有急著寫代碼,而是花了相當多的上下文去拆解需求,明確模塊邊界,選擇技術棧,規劃目錄結構。

      這個階段的體感,和我用 Opus 時非常接近,甚至在某些地方更保守一些,它會反復確認假設,避免在早期做出難以回滾的決策。


      真正拉開差距的是后半段。服務啟動過程中出現了數據庫連接失敗、依賴版本不兼容、并發測試下鎖策略失效的問題。

      GLM-5 沒有把錯誤拋回給我,也沒有給出泛泛的建議,它會主動讀取日志,調整配置,重跑測試,再根據新的輸出修正判斷。

      這個循環持續了相當長時間,中間我幾乎沒有干預。



      最終的結果談不上優雅,但可以穩定運行,代碼結構清晰,部署流程完整。

      這種體驗,和過去用模型寫代碼還挺不一樣是,它更像是一個愿意自己把事情收尾的工程師。

      身邊算法和工程的伙伴都在一頭扎進去用了,說這樣的能力,居然能免費,真的是讓人心里有愧的程度。

      02.從GLM?4.7到GLM?5,驚喜很大

      想起一個多月前,智譜才剛剛更新到 GLM?4.7,當時就覺得不錯。

      沒想到這么快的時間,GLM?5的版本又有了大的提升。


      據介紹,GLM-5 的參數規模是上一代 GLM-4.7 的兩倍,從 3550 億提升至 7440 億,訓練數據量從 23 萬億增至 28.5 萬億 tokens,更大規模的預訓練算力顯著提升了模型的通用智能水平。

      這兩天,一波開發者都積極用了起來。

      “GLM-5 現在已經能和 Opus 4.6 同臺競技了。”

      看到國外一位開發者說,“我一整個上午都在編程任務和游戲環境里折騰 GLM-5。整體來說,它在某些任務上執行得很快,表現不錯,但碰到更復雜的場景,對我而言 Claude 依然是王者。”

      另一位開發者則稱,GLM-5 表現得很完美,絕對是目前發布的最優秀開源模型之一。

      “我在 Ollama 命令行和 Claude Code 里都跑了一遍。我發現 Claude Code 里有個缺陷,但找到了臨時解決辦法。我的 GLM-5 對話會話達到了和 Opus 4.6 同一水準的自我認知 / 理解深度。”


      還有開發者評價道,“GLM-5 可能真的是我第一次在前端任務上更傾向于選擇非 Gemini 模型。”


      “價格簡直離譜”,有開發者算完后表示,GLM5 的輸入成本比 Opus 便宜 6 倍,輸出成本便宜 10 倍。


      如果把 GLM-4.7 看作是開源代碼能力的達標,那 GLM-5 更像是第一次真正走進可用區間。

      它開始具備完成大任務的耐心,也開始具備在復雜系統中維持一致性的能力。這種變化,對整個行業的意義非常大。

      隨著 Agent 任務變長,Token 消耗不可避免地暴漲,模型的效率、成本和可部署性變得前所未有的重要。

      GLM-5 在架構上的一系列選擇,使它能夠在長上下文中保持穩定表現,同時降低實際運行成本。

      這種平衡,是未來一段時間內推動 Token 使用量增長的重要因素。


      03.智譜GLM-5給新年起了個好頭

      在我看來,無論是 Opus 4.6,還是 GPT-5.3 Codex,它們幾乎都不再強調 One Shot,不再強調一句 Prompt 直接生成結果,也不再把“好看”“炸裂”放在最顯眼的位置。

      相反,它們反復提到長任務、Agentic、多步驟規劃、持續執行,甚至主動承認這些任務會跑很久,會消耗大量 Token。

      這種變化背后,其實是一個非常清晰的判斷。

      前端 Demo 的天花板已經不低了,再繼續卷審美、卷生成速度,價值增量開始變小。

      真正決定模型高度的,開始變成另一件事,它能不能在一個復雜目標下持續工作,能不能在失敗之后修正路徑,能不能在沒有人盯著的情況下把一件工程意義上的事情完成。


      從 Opus 到 GPT-5.3 Codex,再到 GLM-5,我看到的并不是誰替代誰,而是一條清晰的演進路徑。大模型正在從會寫,走向會完成,從好看,走向可靠,從短暫的對話,走向持續的工程。

      如果你仍然只需要一個能快速生成前端頁面的工具,這一代變化與你關系不大。如果你需要一個能陪你跑完整個項目周期,愿意反復調試,最終把系統跑通的助手,GLM-5 已經站在了這個位置上。

      大模型的故事,終于開始認真了。


      國產大模型的能力曲線正在整體上揚,也是很讓我們這些從業者樂觀的信號。

      視頻生成,像Seedance 2.0這樣的模型,已經在生成穩定性、動態一致性和長時序控制上,拿出了接近全球第一梯隊的表現。


      智譜GLM-5和Seedance 2.0,我愿看作國產大模型的雙子星

      國內頭部團隊,在多模態底層架構與訓練工程上,已經具備了正面競爭的實力。

      而這次GLM-5的發布,同樣帶來了一些超出行業預期的結果,尤其是在代碼理解、復雜邏輯生成和多輪推理場景中的表現,已經對齊了國際頭部模型。

      這背后反映的,是國產模型訓練范式、數據策略以及算力調度能力的整體成熟,也意味著在 AI coding 這個最能體現模型真實能力的賽道里,差距正在被持續壓縮。

      智譜的卡現在已經很難搶了,不少中型AI公司的老板,都在囤,覺得智譜的模型和算力接下來一定會漲價,趁早多買點備用……

      馬年,一定是國內AI玩家們,策馬奔騰的一年。

      智譜GLM-5開了個好頭,我們都要加油跟上!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      普京時代進入倒計時,中國必須警惕俄羅斯政策突變

      普京時代進入倒計時,中國必須警惕俄羅斯政策突變

      阿七說史
      2026-04-18 15:47:09
      事發浦東機場!女子稱兩次拒絕幫陌生人帶行李,多名網友:我也遇到過!

      事發浦東機場!女子稱兩次拒絕幫陌生人帶行李,多名網友:我也遇到過!

      上觀新聞
      2026-04-18 20:28:04
      點球大戰擊敗馬競,皇家社會第三次奪得國王杯冠軍

      點球大戰擊敗馬競,皇家社會第三次奪得國王杯冠軍

      懂球帝
      2026-04-19 06:11:06
      英媒批評趙心童半場表現:看起來一點不自在,總讓自己處在危險中

      英媒批評趙心童半場表現:看起來一點不自在,總讓自己處在危險中

      楊華評論
      2026-04-18 21:40:51
      5月1日起全國嚴查!開車上班、做生意,這些小事別再碰,輕則罰款

      5月1日起全國嚴查!開車上班、做生意,這些小事別再碰,輕則罰款

      荷蘭豆愛健康
      2026-04-19 03:44:44
      在氣質面前,年輕真的不值一提。

      在氣質面前,年輕真的不值一提。

      小椰的奶奶
      2026-04-19 01:52:39
      恒大集團許家印被抓捕全過程

      恒大集團許家印被抓捕全過程

      新浪財經
      2026-04-18 20:05:24
      伊朗宣布關閉霍爾木茲海峽

      伊朗宣布關閉霍爾木茲海峽

      財聯社
      2026-04-19 02:25:05
      狀態略有起伏!趙心童世錦賽衛冕首戰打響,第一階段5-4暫時領先

      狀態略有起伏!趙心童世錦賽衛冕首戰打響,第一階段5-4暫時領先

      全景體育V
      2026-04-18 21:09:21
      4.8萬紫檀珠直播被砍暈!彈幕比妖怪還犀利?遲重瑞憋不住了

      4.8萬紫檀珠直播被砍暈!彈幕比妖怪還犀利?遲重瑞憋不住了

      鑒史錄
      2026-04-18 17:55:00
      拒爆冷!趙心童四連鞭完勝海菲爾德,衛冕冠軍率先闖進世錦賽16強

      拒爆冷!趙心童四連鞭完勝海菲爾德,衛冕冠軍率先闖進世錦賽16強

      世界體壇觀察家
      2026-04-19 05:24:48
      魏建軍發布會現場痛批營銷團隊5分鐘:無法轉化工程師成果“相當于犯罪”

      魏建軍發布會現場痛批營銷團隊5分鐘:無法轉化工程師成果“相當于犯罪”

      三言科技
      2026-04-18 20:55:06
      日本軍艦闖入臺灣海峽后,日媒發現不妙,中國在東海劃5處警戒區

      日本軍艦闖入臺灣海峽后,日媒發現不妙,中國在東海劃5處警戒區

      章荳解說體育
      2026-04-18 14:35:49
      跑路,欠下4億貨款,被資本熱捧的“女版劉強東”,怎么徹底涼了

      跑路,欠下4億貨款,被資本熱捧的“女版劉強東”,怎么徹底涼了

      毒sir財經
      2026-04-18 22:18:23
      57歲好萊塢女星太敢說:自曝生猛夫妻生活,不用生娃更盡興

      57歲好萊塢女星太敢說:自曝生猛夫妻生活,不用生娃更盡興

      橙星文娛
      2026-04-18 16:47:02
      中央一錘定音:4月中旬起,公務員退休徹底告別“彈性延遲”

      中央一錘定音:4月中旬起,公務員退休徹底告別“彈性延遲”

      娛樂的宅急便
      2026-04-18 20:29:53
      好消息!獨生子女證2026可補辦!6類家庭速辦,補貼早領早安心

      好消息!獨生子女證2026可補辦!6類家庭速辦,補貼早領早安心

      復轉這些年
      2026-04-18 12:27:49
      北影節紅毯:高圓圓美的驚心動魄,被周冬雨嚇了一跳,高葉太敢穿

      北影節紅毯:高圓圓美的驚心動魄,被周冬雨嚇了一跳,高葉太敢穿

      糊咖娛樂
      2026-04-17 11:24:40
      決裂?姆巴佩硬剛皇馬!拒絕克洛普執教,力挺一人入主

      決裂?姆巴佩硬剛皇馬!拒絕克洛普執教,力挺一人入主

      奶蓋熊本熊
      2026-04-19 00:32:00
      何潤東助陣宿遷拿下南京,狂拿五個商務,應該感謝《逐玉》

      何潤東助陣宿遷拿下南京,狂拿五個商務,應該感謝《逐玉》

      影視地平線
      2026-04-18 22:47:32
      2026-04-19 07:19:00
      AI異類 incentive-icons
      AI異類
      從硅谷到中關村,AI信息與測評
      157文章數 6關注度
      往期回顧 全部

      科技要聞

      傳Meta下月擬裁8000 大舉清退人力為AI騰位

      頭條要聞

      伊朗革命衛隊向油輪開火 伊朗最高領袖發聲

      頭條要聞

      伊朗革命衛隊向油輪開火 伊朗最高領袖發聲

      體育要聞

      時隔25年重返英超!沒有人再嘲笑他了

      娛樂要聞

      劉德華回應潘宏彬去世,拒談喪禮細節

      財經要聞

      "影子萬科"2.0:管理層如何吸血萬物云?

      汽車要聞

      奇瑞威麟R08 PRO正式上市 售價14.48萬元起

      態度原創

      藝術
      數碼
      健康
      教育
      親子

      藝術要聞

      夜色下的歐洲

      數碼要聞

      華為版的科技春晚來了!Pura 90/Pura X Max下周發:陣容豪華

      干細胞抗衰4大誤區,90%的人都中招

      教育要聞

      北京:長幼隨學!繼續積極為多孩子女同校就讀創造條件

      親子要聞

      老公終于夢想成真了!幫忙給寶寶起小名唄

      無障礙瀏覽 進入關懷版