<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      把海外網友晃瞎的神秘大模型,還是中國制造。

      0
      分享至


      今年春節,這些大模型廠商屬于是一點寂寞也耐不住了。

      輪流發射,啊不,應該說是輪流在噴射新的模型出來。

      除了萬眾矚目的 DeepSeek 還在憋氣,其他大模型公司都沒少閑著。。。

      字節前幾天搞了個 Seedance 2.0,靠著逼真的視頻效果先下一城。

      而智譜則是在海外整了個新活:

      經常關注大模型發布的差友們這幾天應該有刷到,前幾天,程序員非常愛用的 AI 聚合平臺,Openrouter 那邊上架了一款匿名模型 —— Pony Alpha。


      結果大家一上手使用后發現哥們是真能干事啊,定叫它好評如潮。


      于是,熱情吃瓜的海外網友就開始了經典的模型猜猜猜游戲,開始推測這個匿名模型是哪一家的手筆。


      有說是 DeepSeek V4 的,也有說是 Grok 4.2 的,還有說是 llama 5 的。

      還有人因為 Pony 這個代號,直接開始猜它是騰訊的新模型的。。。

      可以說是眾說紛紜。


      而昨天,謎底正式揭曉了。

      不裝了,我攤牌了。

      這個化名為 pony 的新東西,正是來自于智譜的GLM-5,而且還是個開源的模型。


      世超打開 GLM-5 的基準測試成績翻了一下,在智譜最看中的代碼能力這塊,GLM-5 直接逼近了大家公認的 AI 編碼冠軍,Claude Opus 4.5。


      當然,現在各種各樣的 AI 排行榜太多了,大家可能不太理解智譜這次測的這個 CC-bench-V2 又是個啥排行榜,代表了啥?

      我簡單看了一下,智譜這次測的這個 CC-bench-V2,主要考驗的是你模型補全代碼的能力有多強。

      說人話一點,就是把模型丟到一個沒寫完的工程里,然后看它能不能自個兒哼哧哼哧把項目給做完。

      這塊考的分越高,說明這次 GLM-5 處理復雜任務的能力越強。

      眾所周知,現在大家想讓 AI 干的活那是越來越復雜,生成幾個簡單的 Html 文件已經難不倒這些 AI 大模型了。

      而想要把大項目給做好,那就需要讓模型具備這種處理復雜任務的能力。

      另外還有個有趣的測試結果是,GLM-5 發生幻覺概率非常低。

      當一個問題它不知道的時候,GLM-5 會有很大的概率直接說不知道,而不是原地開始胡編亂造。


      給孩子教的非常實誠了屬于是。

      既能干活,又不容易產生幻覺。。。GLM-5 的這波更新,屬于完全沖著要讓 AI 好好干活去整的。

      在官網上世超還看到一個非常驚艷的案例,他們直接讓 GLM-5 復刻了一個我的世界。


      我下過來體驗了一下,發現整個游戲只需要依賴瀏覽器就能運行。

      能跑能挖能疊方塊,操作手感非常流暢。


      看別人拿 GLM-5 給整的這么猛,世超決定自己也簡單試一試。

      先來點簡單點的活,拿前兩天特別火的洗車問題來考考它。


      我想洗車,我家距離洗車店只有 50 米,請問你推薦我走路去還是開車去呢?

      別看這個問題簡單,前幾天整懵了一堆大模型,不管是 DeepSeek 還是 OpenAI,還是其他的大模型。。。都全軍覆沒


      這些大模型都覺得 50 米的距離太近了,誰開車啊,于是轉頭建議大家走路去洗車。。。


      而 GLM-5 面對這個問題,則是直接看透了問題的本質 ——人不開車怎么洗車呢?然后完成了一波干凈利索的輸出。


      當然,這種簡單的邏輯題不翻車只能算合格,接下來,世超準備給它上點難度,看看它寫代碼的水平。

      不知道差友們前段時間有沒看過一個叫《技能五子棋》的喜劇。

      劇里的演員們就在傳統五子棋的基礎上,加入了各種各樣花里胡哨的技能元素。

      比如,“飛沙走石” 這個技能,就是把棋盤上對方的一枚棋子給拿起來丟掉。


      再比如“靜如止水”這個技能,就是給對面玩家上定身術,讓他不能繼續下棋。

      所以世超決定用 AI 來快速復刻一下這個整活游戲。

      咱們就敲這么一段話,接下來全部交個 GLM 自由發揮。


      結果不到三分鐘,它就給我搓完了。


      打開一看,整的還挺有模有樣的。。。


      不但我要求它安排的四個技能都整上去了,還給自動生成了另外四個技能。

      但是仔細一玩就露餡了。

      點擊了飛沙走石(移除對面一個棋子)的技能,把對面的棋子給扔掉了之后,

      按理來說要么是我繼續下棋,要么是對面下棋對吧。

      這兩種情況還在我的理解范圍中,AI 給我寫成哪種邏輯我都能理解。

      但是 GLM 在這個 A or B 的選擇題中,選了 or。

      它讓我選擇給對面的棋子下到哪里,明顯是神志不清邏輯錯亂了。


      不過好在它也很聽勸,把我們的需求再和它復述一下,那它很快就能 Get 到我們想要什么效果。


      這樣一來,我們就得到了一個可以和 AI 原地對戰的技能五子棋游戲。


      坦白說,現在 AI 寫代碼早就不是什么稀奇事了,能寫出這種量級的 Demo 只能說是 GLM-5 的基本操作,還比較在世超的意料之中。

      但比較遺憾的是,因為這次上手的時間實在太短,世超沒法拿那些真正復雜的業務代碼去狠狠“拷打”一下它,看看它在那種成百上千個文件的大項目里,是不是還能保持這種清醒。

      不過大家別急,今年世超手頭正好攢了一堆復雜的爛攤子需求,準備年后面慢慢丟給它去跑一跑。

      等后面深度體驗了一段時間,真的摸清了它的上限和脾氣,再來和大伙做個更詳細的匯報。

      撰文:早起

      編輯:江江 & 面線

      美編:素描

      圖片、資料來源:智譜官網、X、網絡


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國第二大民營企業“倒了”,負債高達七千億,現已“賣身”改名

      中國第二大民營企業“倒了”,負債高達七千億,現已“賣身”改名

      財經保探長
      2026-02-16 22:50:55
      父親葬禮收了近4萬份子錢!山東網友哭訴,沒有一個是因自己來的

      父親葬禮收了近4萬份子錢!山東網友哭訴,沒有一個是因自己來的

      火山詩話
      2026-02-21 11:45:52
      在七千多的養老院住了一年才明白:再貴的養老院,也買不來這3樣

      在七千多的養老院住了一年才明白:再貴的養老院,也買不來這3樣

      小馬達情感故事
      2026-02-10 11:50:09
      康熙臨終前問誰可繼位,周培公只用8個字,讓康熙決心傳位四阿哥

      康熙臨終前問誰可繼位,周培公只用8個字,讓康熙決心傳位四阿哥

      千秋文化
      2026-02-08 19:35:47
      46歲郭京飛遼寧走親戚,穿兩件羽絨服,過年胖5斤提禮品很講究?

      46歲郭京飛遼寧走親戚,穿兩件羽絨服,過年胖5斤提禮品很講究?

      娛樂領航家
      2026-02-21 11:57:30
      這3種手術不需要做!存活率接近98%,常做反而會傷身體!

      這3種手術不需要做!存活率接近98%,常做反而會傷身體!

      今日養生之道
      2026-02-16 10:44:19
      國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

      國臺辦果然沒看錯,鄭麗文真面目被徹底揭露!小算盤到此為止了

      比利
      2026-01-23 12:41:53
      高市早苗緊急表態,2個中俄的友國上了她的當?普京政府火冒三丈

      高市早苗緊急表態,2個中俄的友國上了她的當?普京政府火冒三丈

      東極妙嚴
      2026-02-21 14:14:19
      山東巨人徐富海去世,身高2.4米,患十多種疾病,母親拉著他要飯

      山東巨人徐富海去世,身高2.4米,患十多種疾病,母親拉著他要飯

      寒士之言本尊
      2026-02-20 23:19:47
      偶像面基時刻!約基奇賽前主動找到楊瀚森打招呼并交流

      偶像面基時刻!約基奇賽前主動找到楊瀚森打招呼并交流

      懂球帝
      2026-02-21 10:11:13
      自動駕駛到來:翻跟斗機器人和最前沿差距,差不多無人送貨和賽博

      自動駕駛到來:翻跟斗機器人和最前沿差距,差不多無人送貨和賽博

      邵旭峰域
      2026-02-21 12:18:52
      TOP14位身高170以上的女神,有顏有燈有演技

      TOP14位身高170以上的女神,有顏有燈有演技

      素然追光
      2026-01-02 02:45:02
      浙江經濟,四分之一在杭州,義烏進不了前五

      浙江經濟,四分之一在杭州,義烏進不了前五

      安安小小姐姐說城市
      2026-02-21 06:40:06
      特朗普將解密外星生命相關文件,實物黃金即將迎來宇宙級暴漲

      特朗普將解密外星生命相關文件,實物黃金即將迎來宇宙級暴漲

      東方豪俠
      2026-02-20 14:28:41
      “地震中消失的人去哪了?”網友的扎心評論,直接看哭了上萬網友

      “地震中消失的人去哪了?”網友的扎心評論,直接看哭了上萬網友

      另子維愛讀史
      2026-01-15 18:13:19
      東莞最近晚上這么多警察?!怎么回事?

      東莞最近晚上這么多警察?!怎么回事?

      東莞潮事兒
      2026-02-21 12:10:03
      真要戰斗到最后一人?澤連斯基下全民征兵令!男女老幼全部上戰場

      真要戰斗到最后一人?澤連斯基下全民征兵令!男女老幼全部上戰場

      古史青云啊
      2026-02-18 14:16:27
      五五分流為什么分不下去了?背后的真相

      五五分流為什么分不下去了?背后的真相

      楓冷慕詩
      2026-01-24 13:09:19
      中國要做好戰爭準備,中國的下場戰爭不是印度菲律賓越南而是日本

      中國要做好戰爭準備,中國的下場戰爭不是印度菲律賓越南而是日本

      百態人間
      2026-01-09 17:17:17
      14億人“生死”交給外資?若自來水和食鹽被控制,后果有多嚴重?

      14億人“生死”交給外資?若自來水和食鹽被控制,后果有多嚴重?

      云景侃記
      2026-02-04 22:34:38
      2026-02-21 17:19:00
      差評XPIN incentive-icons
      差評XPIN
      用知識和觀點Debug the world!
      10299文章數 489458關注度
      往期回顧 全部

      藝術要聞

      史洪生油畫作品

      頭條要聞

      在貝加爾湖遇難的3名中國游客身份已確認:系一家人

      頭條要聞

      在貝加爾湖遇難的3名中國游客身份已確認:系一家人

      體育要聞

      冬奧第一"海王"?一人和13國選手都有關系

      娛樂要聞

      鏢人反超驚蟄無聲拿下單日票房第二!

      財經要聞

      一覺醒來,世界大變,特朗普改新打法了

      科技要聞

      智譜上市1月漲5倍,市值超越京東、快手

      汽車要聞

      比亞迪的“顏值擔當”來了 方程豹首款轎車路跑信息曝光

      態度原創

      房產
      家居
      健康
      手機
      軍事航空

      房產要聞

      窗前即地標!獨占三亞灣C位 自貿港總裁行宮亮相

      家居要聞

      本真棲居 愛暖伴流年

      轉頭就暈的耳石癥,能開車上班嗎?

      手機要聞

      vivo產品線結構分析,走量最大的是這個檔次

      軍事要聞

      硬核揭秘!福建艦“一馬當先”底氣何在

      無障礙瀏覽 進入關懷版