<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      深入談談GLM-5-Turbo:先有模型,后有Agent

      0
      分享至

      大家好,我是最近有點焦慮的冷逸。

      焦慮的原因是,龍蝦太火了,市面上魚龍混雜,大家體驗后覺得不過如此,又把它給卸載了,回到過去“能工智能”的老路。

      以至于網上有個段子:有人花499請人上面安裝OpenClaw,在用了幾天后實在難用而且又不知道怎么刪除,于是花了299找人上門卸載,結果卸載后電腦藍屏,只得再花1000找人恢復數據。


      圖由Lovart生成

      普及Agent本是好事,但如因為濫竽充數導致人們對AI大失所望,反而會透支行業信用。

      所以,又挺讓人焦慮的。

      我在很多地方都分享過一個觀點:用好龍蝦,關鍵在于模型和Skills。

      如果沒有好的底層模型,沒有找到好的場景Skills,那還真不如“能工智能”,畢竟人可以無限Token,微信直接發布命令……


      模型這塊,現在已經有幾個不錯的模型了,比如GPT-5.4、Claude Opus 4.6、Gemini 3 Flash等。

      但說實話,真不便宜,而且也有門檻,很多人用不了。

      今天,智譜發布了「全球首款龍蝦模型」GLM-5-Turbo,專門針對龍蝦工作流進行優化。

      在ZClawBench上取得了僅次于Claude Opus 4.6的全面表現,相比自己的GLM-5更是提升顯著。


      ZClawBench大家可能比較陌生,我給大家簡單介紹一下。這是一個基于大量OpenClaw的真實用例,專門用來評估模型在真實工作流中執行能力的測評基準。

      不同于傳統的Benchmark,ZClawBench更接近Agent能力測評,不只是看模型會不會答問題,而是看模型能不能完成一件完整的事情。

      龍蝦任務講求成功率,并不是模型的參數越大越好,而是要專門對Agent任務(比如工具調用、多步規劃)進行優化,同時兼顧推理效率(也就是速度)。

      所以,一般是用推理效率更高的中端或輕量級模型來跑龍蝦,任務成功率會更高一些。GLM-5-Turbo,便是基于GLM-5基座調優出來的龍蝦增強模型

      很多人玩龍蝦,喜歡用它來做定時任務,但你發覺沒有,經常定著定著它就沒有時間觀念了,可能隔幾天就忘記了前面的設定。

      這本質上是模型長文本instruction following能力的缺陷,導致它容易“失憶”,或者無法被喚醒。

      針對這個問題,GLM-5-Turbo進行了專項優化,不僅能拆解復雜指令、指揮多智能體協作,還能在“時間維度”上保持對指令的長期記憶,確保長任務持續執行不斷線。

      所以,它很擅長處理定時和持續性任務,能夠保持長任務不中斷。

      如果你最近有用過澳龍(AutoClaw),你就會發現上面多了一個叫Pony Alpha-2的模型。


      在海外,有很多老哥猜測這到底是什么模型。比如@Numman Ali 就說,Pony Alpha-2看起來像Opus級別的模型。


      今天,智譜官方揭曉:這其實就是GLM-5-Turbo

      我們也第一時間在澳龍里測了測,給大家看下我的一手體驗。

      我的任務是:

      到豆瓣 https://movie.douban.com 搜索最近熱門的電影,結合熱度、評分和上映時間綜合篩選10部電影給我,整理成Excel表格,并根據Excel表格的信息設計一個可視化HTML,最后把Excel和HTML一并發到我的飛書上。

      這個任務其實挺復雜的,澳龍要自己上網篩選信息→總結內容→生成表格→編寫代碼→自動發送到飛書。

      這里面一共有5步,分別調用了搜索工具、文檔工具、IM接口和模型Coding能力,很多模型走到第3步就崩了。

      問題出在哪?會聊天≠會干活。

      龍蝦任務需要的是連續執行、精準調用工具、長時間不斷線……這些,通用模型沒有專門訓過,根本就不會。

      而搭載了GLM-5-Turbo的澳龍,它真的把Excel和HTML就直接給了我。


      是的,就直接給了我,連過程它都沒有輸出幾句廢話……是不是像極了你們公司剛入職賣力干活求轉正的新員工?

      那來看下最終的結果呢?


      臥槽,我還以為我打開的會是一個一看就是Python寫的原始表格。沒想到,它連配色、排版這些都考慮到了,我直接就可以用。

      生成的可視化網頁,這塊我完全相信GLM模型的Coding能力。


      接著,我又測了一個任務,這是我很早就想做的定時任務,讓大模型來監控DeepSeek,看他們公司究竟什么時候發新模型。

      一旦有新動態,第一時間通過飛書滴我。

      任務需求是:

      這是DeepSeek的4個官方信息發布渠道:
      https://github.com/deepseek-ai
      https://huggingface.co/deepseek-ai
      https://www.xiaohongshu.com/user/profile/66821202000000001b01a005
      https://x.com/deepseek_ai

      請監控這4個url,每隔30分鐘給我匯報一次DeepSeek的最新動態,并通過飛書反饋給我。

      需要注意:
      1.如果DeepSeek有發布新模型/新消息,請匯報詳細情況,并貼出信息地址;如果無新消息,也要匯報,但是內容略。
      2.如果DeepSeek發布了新模型(比如DeepSeek V4),請第一時間通過飛書滴我,緊急告知。
      3.僅監控這4個渠道。
      4.2025年以前的消息都可以忽視,只看2026年以后的。

      真的,一開始我都不抱希望,因為這里面涉及到各種反爬機制,很多模型大概率會失敗。

      之后,我就去吃飯了。2個小時后回來,沒想到它真的開始監控了。


      并成功通過飛書推送了監控報告。到發稿,我這個定時任務依然還在跑著。


      它創建這個定時任務的思考過程超長超長,但你別管人家怎么想的,最終就是搞定了。


      我只能說,真的,智譜。

      這真的解決了我很早就想做但一直沒能去做的需求問題,而今天我只口噴了幾句提示,GLM-5-Turbo就接管了我的需求。

      價格方面,這次智譜專門搞了個龍蝦套餐,支持個人和Team訂閱。

      • Claw體驗月卡,3500萬Tokens,39元/張;

      • Claw進階月卡,1億Tokens,99元/張。

      說實話,對于高頻養蝦戶來說,1億Tokens可能不太夠。

      之前GLM模型就一直供不應求,我估計這個龍蝦套餐也會很快售罄(還是算力緊張給影響的),需要的朋友,得早點下手了。


      訂閱地址:https://www.bigmodel.cn/claw-plan-team

      除Claw套餐外,他們家的Coding Plan Max套餐已經支持GLM-5-Turbo。很幸運,我在春節前就買了他們的Max套餐,現在算是實現了“GLM模型自由”。

      真的,還是那句話,底層模型太重要了

      沒有優秀的底層模型,即使你的Agent框架設計得再好,soul、memory、Heartbeat、skills設計得再漂亮,也是白搭。

      先有模型,后有Agent。


      最近,我看到一個觀點:

      「大模型,不是一個只安靜呆在底下給你調API的基礎設施,它本身就是智能,就是認知,就是那個會持續進化、持續吞并、持續往上吃的東
      西。」(by@Melly在硅谷)

      深感認同!我們不應被Agent表面的繁榮轉移了注意力,底層模型的進化,才是定義這個時代的根本力量。

      框架和應用可能是時代的弄潮兒,但只有模型本身才是推動這個時代的潮水。

      所以,我是真的很高興,今天能夠看到有這么厲害的國產龍蝦模型面世。

      最后,再分享一個行業細節:近期,OpenAI內部已經將核心KPI從傳統的DAU(日活躍用戶數)轉向了TPD(每日Token消耗量)。

      這什么意思呢?未來衡量AI的價值不是有多少人在用,而是AI替人類干了多少活。

      不知道大家有沒有注意,現在提Token,大家也都能明白,都能理解了,并不需要你給他科普 1 Token到底等于等于幾個漢字、幾個單詞。

      沒人在乎Token的具體含義,但人人都在談Token。

      這就是,時代真的變了。

      而我們,每個人都成了時代的一份子。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      央國企的內幕被網友們扒得干干凈凈!

      央國企的內幕被網友們扒得干干凈凈!

      燈錦年
      2026-04-28 00:05:06
      廣東vs廣州季后賽G1前瞻:杜鋒完整陣容迎主場首秀 徐昕欲反戈舊主

      廣東vs廣州季后賽G1前瞻:杜鋒完整陣容迎主場首秀 徐昕欲反戈舊主

      狼叔評論
      2026-04-28 01:00:06
      我48歲剛再婚就發現懷孕,兩天后丈夫質問:孩子到底怎么回事

      我48歲剛再婚就發現懷孕,兩天后丈夫質問:孩子到底怎么回事

      千秋文化
      2026-04-27 20:03:20
      為天地立心,為生民立命!近五十年內改變世界的七大企業

      為天地立心,為生民立命!近五十年內改變世界的七大企業

      高博新視野
      2026-02-05 15:59:02
      飛馳人生4!張雪機車奪WSBK世界冠軍,碾壓卡迪、川崎等豪強

      飛馳人生4!張雪機車奪WSBK世界冠軍,碾壓卡迪、川崎等豪強

      垛垛糖
      2026-03-29 20:27:09
      炸裂!女子剛分手就獻身異性,男友尾隨當場抓獲,情夫赤裸一臉懵

      炸裂!女子剛分手就獻身異性,男友尾隨當場抓獲,情夫赤裸一臉懵

      李晚書
      2026-04-21 16:43:59
      美國國債即將突破40萬億,但她絕對不會因此而衰落

      美國國債即將突破40萬億,但她絕對不會因此而衰落

      爆角追蹤
      2026-04-27 16:53:27
      85 歲何守信回港!TVB 頂級飯局曝光,港圈半壁江山齊聚

      85 歲何守信回港!TVB 頂級飯局曝光,港圈半壁江山齊聚

      橙星文娛
      2026-04-27 13:23:53
      太瘋了!!遭遇死亡威脅!他全家都被威脅....

      太瘋了!!遭遇死亡威脅!他全家都被威脅....

      柚子說球
      2026-04-27 21:45:49
      糾纏5年后去父留子 ,終于分了。

      糾纏5年后去父留子 ,終于分了。

      In風尚
      2026-03-31 17:33:34
      新寶馬7系亮相北京車展,車外霸氣,車內狂野

      新寶馬7系亮相北京車展,車外霸氣,車內狂野

      車動態
      2026-04-27 17:31:19
      新型窮人越來越多了:有車有房,銀行卡存款長期三位數!

      新型窮人越來越多了:有車有房,銀行卡存款長期三位數!

      燈錦年
      2026-04-27 14:08:53
      殲-10C實戰越猛,買家越少?埃及印尼泰國接連放棄,真相藏不住了

      殲-10C實戰越猛,買家越少?埃及印尼泰國接連放棄,真相藏不住了

      起喜電影
      2026-04-27 18:25:25
      記者現場探訪:普通山坡藏著“金色”線索

      記者現場探訪:普通山坡藏著“金色”線索

      半島晨報
      2026-04-25 19:11:46
      獵鷹重型第12次飛

      獵鷹重型第12次飛

      NASA愛好者
      2026-04-28 00:36:13
      四年暴跌120億,微信是怎么“殺死”口香糖行業的?

      四年暴跌120億,微信是怎么“殺死”口香糖行業的?

      流蘇晚晴
      2026-04-19 20:34:47
      胡錫進以安全代言沃爾沃,是整個社會的恥辱

      胡錫進以安全代言沃爾沃,是整個社會的恥辱

      黔有虎
      2026-04-19 17:34:12
      西方害怕中國治沙?《自然》新評暴露真相:他們怕的不是沙漠消失

      西方害怕中國治沙?《自然》新評暴露真相:他們怕的不是沙漠消失

      閱盡天下大事
      2026-04-27 11:50:53
      俄導彈來襲:烏防空似鬧劇民代價沉重

      俄導彈來襲:烏防空似鬧劇民代價沉重

      小眼睛小世界
      2026-04-27 06:30:01
      孫楊回應被稱“高需求寶寶”:我們所有時間都在泳池和治療室里度過,沒有太多業余生活,非常希望回家后,能感受愛的溫暖

      孫楊回應被稱“高需求寶寶”:我們所有時間都在泳池和治療室里度過,沒有太多業余生活,非常希望回家后,能感受愛的溫暖

      魯中晨報
      2026-04-27 17:48:14
      2026-04-28 01:32:49
      沃垠AI incentive-icons
      沃垠AI
      努力分享一些有用、有趣的AI干貨
      83文章數 34關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4上線三天,第一批實測出來了

      頭條要聞

      坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

      頭條要聞

      坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

      體育要聞

      人類馬拉松"破二"新紀元,一場跑鞋軍備競賽

      娛樂要聞

      黃楊鈿甜為“耳環風波”出鏡道歉:謠言已澄清

      財經要聞

      Meta 140億收購Manus遭中國發改委否決

      汽車要聞

      不那么小眾也可以 smart的路會越走越寬

      態度原創

      教育
      本地
      旅游
      數碼
      公開課

      教育要聞

      學生課堂偷吃、聽課“擺爛”……這位老師的應對方式絕了!

      本地新聞

      云游中國|逛世界風箏都 留學生探秘中國傳統文化

      旅游要聞

      茶卡鹽湖的那顆"心" 為什么讓人心里不舒服?

      數碼要聞

      LABUBU冰箱還未正式發售就已溢價3000元

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻体验按摩到忍不住哀求继续 | 欧美人妻少妇| 国产精品毛片一区二区| 中文字幕亚洲国产精品| 国产亚洲精品??码| 成人AV影院| 庄浪县| 中文字幕人妻小说| 豆国产96在线 | 亚洲| 欧美顶级裸体met自慰| 国产一区二区黄色在线观看| 久久久久成人精品| 一区二区三区国产| 亚洲综合国产伊人五月婷| 孕妇怀孕高潮潮喷视频孕妇| 亚洲欧洲制服| 无码一区二区三区人| 亚洲国产精品久久艾草| 中文字幕精品人妻| 午夜亚洲国产理论片亚洲2020| 亚洲精品沙发午睡系列| 国产成人a亚洲精品久久久久| 亚洲中文字幕久久无码精品A| 亚欧美国产色| 亚洲欧美精品午睡沙发| 三级三级久久三级久久| 老司机午夜福利视频| 91色| 久久尤物av天堂日日综合| 一根材综合成网| 99国产精品永久免费视频| 天堂网在线观看| 偷偷色噜狠狠狠狠的777米奇| 欧洲AV在线| 99久久精品午夜一区二区| 九色精品国产亚洲av麻豆一| 凌海市| 久久久久久av无码免费看大片| 国产一区二区三区精品综合 | 扎赉特旗| 亚洲日韩成人av无码网站|