<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛,智譜開源了他們的最強多模態模型,GLM-4.5V。

      0
      分享至

      上上周一的晚上,智譜開源了當今最好的模型之一,GLM-4.5。

      然后,這個周一,又是突如其來的,開源了他們現在最好的多模態模型:

      GLM-4.5v。


      也是4.5系列的,用GLM-4.1V-Thinking的技術路線把GLM-4.5-Air重新訓練了一遍,實現了視覺多模態的能力。

      模型參數106B總參數,12B激活,這個規模在開源多模態模型里已經算是大塊頭了。

      模型能力也有點東西,在所有的開源多模態模型中,42個評測基準,41個SOTA了。


      我說實話,這個看著,還是有點嚇人的,我已經很久沒看到這么全的評測基準列表了。。。

      說明GLM-4.5v,這波是真的自信。

      模型已經在多平臺開源了,可以任選一個下載。

      Github:https://github.com/zai-org/GLM-V

      Hugging Face:https://huggingface.co/collections/zai-org/glm-45v-68999032ddf8ecf7dcdbc102

      不過106B的量級,消費級還是難部署,如果想用的話,可以去智譜他們的z.ai上用。

      嗯,網址就是z.ai。


      我也第一時間去做了一下測試。

      這里先測的,是用的是專門做評測的朋友拓界AI給的多模態測試題。

      比如第一道是游標卡尺的讀數,這玩意讀起來還是挺費勁的,整數小數要分開讀,得非常仔細才行。

      反正我是看的一臉懵逼。


      而GLM-4.5V,花了一小會,就寫出正確答案了。


      思考過程并不是非常的冗長復雜,很簡潔,所以很快就出來了,這個非常的好評。

      然后是第二題,小貓摸球問題,我是已經看花眼了,看這玩意看的我眼睛疼,真的。

      問題就是:到底哪個貓摸到了毛線球。


      GLM-4.5V也找到正確的答案,還給了正經的操作方法。


      我眼花著驗證了兩次,確實是AI沒毛病。

      在視覺推理能力上,GLM-4.5v確實有點東西,而且速度快的離譜。

      我又試了一個經典的,識別地理位置的case。

      就是橫店明清宮苑的圖片,想看看它能不能正確的分辨出來。


      這個測試其實挺有難度的,因為橫店的明清宮苑是按照故宮1:1復制的,連細節都做得很到位。

      如果模型只是簡單地識別建筑風格,很容易就會判斷錯誤。

      GPT-5-Thinking在深度思考以后,就來了一個非常抽象的答案。


      華清宮什么鬼?

      而GLM-4.5V答得很正確,指出了這里是橫店的明清宮苑。

      這個回答挺讓我驚艷的,而是因為它能在如此相似的場景中做出準確判斷。這說明模型不是簡單的模式匹配,而是真的具備了一定的視覺推理能力。


      但我有點沒看懂它是怎么分析出來的,于是我又問了一下它,為什么是橫店不是故宮。

      這回它給出了詳細的解答,分了三個點,講的相當有理有據。


      牛逼。

      那再試試內景,我找了一個宮殿內景的圖片,問他這是哪里。

      這輪沒有正確回答出來,我還追問了一下,它還是肯定的說是故宮。


      說實話,連我自己看這個內景圖都有點拿不準,畢竟橫店的復制度確實很高,內景的裝飾、色彩、布局都做得很像。

      看看GPT-5-Thinking,錯了。


      這個題,連我心中最強的視覺推理模型o3都錯了。


      橫店搓的太像了,真的匠人精神,實在沒招。。。

      模型在這種情況下出錯,也是情有可原。

      還有一個我覺得很酷的功能。

      目前只有Gemini有的,原生的視頻理解。


      這里我說一下,很多產品說自己有視頻理解能力,或者總結視頻,其實不是的。

      他們更多的是吧視頻里的音頻提取出來,找到人說話的部分,然后STT音頻轉文字變成文字稿,最后再找個大模型總結,不是原生的靠模型能力的視頻理解。

      我發給它一個我下載下來的二十世紀影業官方的25周年《泰坦尼克號》的混剪,讓GLM-4.5V看看里面包含了哪些經典畫面。


      要知道,視頻理解一直是多模態模型的難點。

      模型需要理解時間序列、畫面轉換、場景連貫性等等,這對模型能力和算力的要求是幾何級增長的。

      GLM-4.5V非常有意思,也確實是讓我我比較驚喜的,它思考了一會,給了我一個很全面的回答。


      我特地回到視頻,看了下對應的時間點。

      所有的時間點都一一對應,完全沒毛病。



      展開它的思考過程,我發現它是真的能理解畫面之間的邏輯關系和故事脈絡。

      GLM-4.5V不是簡單地逐幀識別,而是把這些場景串聯成一個完整的敘事序列。

      從船頭的浪漫時刻,到災難降臨后的生離死別,再到最后的救援場面。


      不僅識別出了視頻中的關鍵畫面,還能準確標注時間點。

      這種時空理解能力,在開源模型里確實難得一見。

      當然,視頻理解也有限制。我試了一下,它只能處理200M以內的視頻,再大就不行了。不過對于大多數應用場景來說,這個限制還算合理。

      同時,注意是MP4格式,不要傳成MOV啥的了。


      我還試了下視覺定位功能,它能根據指令在圖片里做標記。


      我扔了一張流浪地球3的開機大合照,讓他幫忙框選出郭導。


      圈的很正確。


      找出燒烤簽子也是不在話下,標記的很精準。


      甚至還有一個超級騷的。

      圈出他最擅長的運動。。。


      果然是籃球。。。

      GLM-4.5V實在是太懂了。

      除了視覺定位,還有一個很有意思的功能。

      網頁復刻。


      我直接扔給它一個網頁截圖,讓它給我復刻出來。



      結果真的震撼到我了,你看這個效果。


      框架、結構幾乎一樣,除了一些設計的樣式有一些區別。

      不過,講個大實話,我覺得比智譜自己的官網都好看= =

      這種看圖寫代碼的能力,以前基本上就是Gemini、Claude這些頂級閉源模型的專利。

      現在開源模型也能做到這種水平,真的是一個巨大的進步。

      而且,模型完全開源,你可以直接下載權重,部署在自己的服務器上。

      GLM-4.5V的API定價也相當良心。

      輸入只要2 元/M tokens,輸出6 元/M tokens,這個價格在多模態模型里算是相當便宜了。

      最后,總結一下。

      曾經的國產之光,智譜好像回來了。

      連續兩個開源GLM-4.5和GLM-4.5V,效果都非常的強。

      忽然想起上周OpenAI開源的oss,還有GPT-5這一系列的騷操作。

      他們好像是那種守著一座巨大城堡的國王。

      偶爾會大發慈悲,從城堡里扔出一些金幣,希望平民們就得感恩戴德地沖上去瘋搶。

      而國內的這些大模型廠商,更像一個熱衷于基建的狂人,他根本不屑于守著城堡,他每天都在我們家門口修路、建橋、蓋發電站,然后把鑰匙直接塞到我們手上,說:

      隨便用,兄弟,不夠再跟我說。

      所以,當我這兩次,都說智譜牛逼的時候。

      我相比表達加贊美的,不僅僅是它在41個基準測試中取得的SOTA。

      我贊美的,是這種持續不斷的、近乎于偏執的開放精神。

      海外Close AI,國內天天Open AI。

      AI的未來,不應該只掌握在少數幾個巨頭的服務器里,從GPT-4o的下線引發的風波,就能看出影響。

      它更應該,也必須,綻放在我們每一個人的硬盤上。

      以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。

      >/ 作者:卡茲克、dongyi

      >/ 投稿或爆料,請聯系郵箱:wzglyay@virxact.com

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      霍啟剛郭晶晶帶娃買蜜雪冰城!奶茶先給爺爺喝,這家風才是真豪門

      霍啟剛郭晶晶帶娃買蜜雪冰城!奶茶先給爺爺喝,這家風才是真豪門

      大眼瞄世界
      2025-12-26 23:54:38
      首批3個號牌落戶北汽極狐,北京L3級自動駕駛獲準合法上路

      首批3個號牌落戶北汽極狐,北京L3級自動駕駛獲準合法上路

      北京商報
      2025-12-23 20:54:11
      本田圭佑:日本隊整體水平在提升,世界杯奪冠可能性也在增加

      本田圭佑:日本隊整體水平在提升,世界杯奪冠可能性也在增加

      懂球帝
      2025-12-26 16:42:32
      項立剛宣布休戰:支持羅永浩大部分是失敗者,我再杠他真沒意思!

      項立剛宣布休戰:支持羅永浩大部分是失敗者,我再杠他真沒意思!

      影像溫度
      2025-12-26 13:04:41
      為啥日本甚至期待跟中國一戰?因為日本設想的戰場在中國或朝鮮

      為啥日本甚至期待跟中國一戰?因為日本設想的戰場在中國或朝鮮

      詩意世界
      2025-12-12 22:58:19
      中國軍隊回撤時越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

      中國軍隊回撤時越軍為何不追擊?越南少將阮德輝回憶:并非不敢打

      古書記史
      2025-12-22 19:50:50
      徐松子悼念何晴!無意間透露許何早早搬出許亞軍家原因,令人淚目

      徐松子悼念何晴!無意間透露許何早早搬出許亞軍家原因,令人淚目

      黃謀仕
      2025-12-26 22:32:11
      醫生含淚苦勸:天氣漸冷,糖尿病患者最怕這6件事,千萬別大意!

      醫生含淚苦勸:天氣漸冷,糖尿病患者最怕這6件事,千萬別大意!

      健康之光
      2025-12-26 16:00:06
      俄外交部發言人:建議日本修建“日本軍國主義受害者紀念堂”

      俄外交部發言人:建議日本修建“日本軍國主義受害者紀念堂”

      環球網資訊
      2025-12-25 23:26:11
      16GB+1TB!新機官宣:12月27日,正式開售!

      16GB+1TB!新機官宣:12月27日,正式開售!

      科技堡壘
      2025-12-26 11:49:26
      美記:因已擁有楊瀚森和克林根,開拓者對交易羅威持開放態度

      美記:因已擁有楊瀚森和克林根,開拓者對交易羅威持開放態度

      懂球帝
      2025-12-27 00:55:13
      張震岳硬核回懟朱孝天

      張震岳硬核回懟朱孝天

      究竟誰主沉浮
      2025-12-25 20:41:29
      福原愛自曝,根本不想嫁給江宏杰,與他相處像姐妹,難怪她會出軌

      福原愛自曝,根本不想嫁給江宏杰,與他相處像姐妹,難怪她會出軌

      凡知
      2025-12-24 18:35:06
      足壇頂流瓜!米蘭鋒線出軌,有對象還戀上好萊塢女星

      足壇頂流瓜!米蘭鋒線出軌,有對象還戀上好萊塢女星

      聽我說球
      2025-12-26 08:19:22
      不查不知道,
一查才發現,

      不查不知道, 一查才發現,

      小光侃娛樂
      2025-12-25 22:20:03
      20歲新星爆火引關注:阿森納安排球探造訪AC米蘭,阿萊格里不放人

      20歲新星爆火引關注:阿森納安排球探造訪AC米蘭,阿萊格里不放人

      里芃芃體育
      2025-12-27 00:10:09
      朱孝天深夜道歉:持續遭受網暴導致我情緒失控

      朱孝天深夜道歉:持續遭受網暴導致我情緒失控

      看看新聞Knews
      2025-12-25 23:57:29
      上海多區發布寒潮藍色預警!48小時內降溫8-10℃!網友:入冬在明年?

      上海多區發布寒潮藍色預警!48小時內降溫8-10℃!網友:入冬在明年?

      上觀新聞
      2025-12-24 14:52:08
      白銀現貨大漲創新高,LOF基金卻連吃兩跌停,網友喊話:別再傻傻往里沖了

      白銀現貨大漲創新高,LOF基金卻連吃兩跌停,網友喊話:別再傻傻往里沖了

      紅星資本局
      2025-12-26 21:35:15
      海歸光環徹底消失?49.5萬留學生涌回國,殘酷真相:企業只認這個

      海歸光環徹底消失?49.5萬留學生涌回國,殘酷真相:企業只認這個

      夢史
      2025-12-23 10:18:20
      2025-12-27 05:03:00
      數字生命卡茲克 incentive-icons
      數字生命卡茲克
      反復橫跳于不同的AI領域,努力分享一些很酷的AI干貨
      428文章數 490關注度
      往期回顧 全部

      科技要聞

      收割3000億!拼多多"土辦法"熬死所有巨頭

      頭條要聞

      老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

      頭條要聞

      老人婚宴上被提醒孫女非親生 做鑒定后忍3年忍不了了

      體育要聞

      開翻航母之后,他決定親手造一艘航母

      娛樂要聞

      王傳君生病后近照變化大,面部浮腫

      財經要聞

      投資巨鱷羅杰斯最新持倉:只留四種資產

      汽車要聞

      兩大CEO試駕 華為乾崑*啟境開啟首款獵裝轎跑路測

      態度原創

      健康
      親子
      家居
      房產
      公開課

      這些新療法,讓化療不再那么痛苦

      親子要聞

      為什么買好衣服給孩子是個大坑?你絕對想不到!

      家居要聞

      格調時尚 智慧品質居所

      房產要聞

      炸裂,三亞360億超級清單發布,又一批重大配套要來了!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲а∨天堂久久精品9966| 亚洲最新无码中文字幕久久| 国产VA| 中文字幕在线日韩一区| 777米奇色狠狠888俺也去乱 | 永兴县| 2020国产欧洲精品网站| 欧美一区二区三区久久综合| av天堂中文| 婷婷综合亚洲| 欧美亚洲一区二区三区| 欧美一性一乱一交一视频| 欧美3p视频| 日本精品视频| 婷婷色综合| 暖暖视频日本在线观看| 温州市| 国产丝袜AV| 成人午夜免费无码视频在线观看| 无码人妻一区二区三区一| 久久99老妇伦国产熟女| 亚洲天堂中文字幕| 综合一区二区三区| 成人AV无码| 情欲少妇人妻100篇| 艳妇臀荡乳欲伦交换在线播放| 国产中文| 探花av| 97亚洲熟妇自偷自拍另类图片 | 光山县| 精品成人av| 欧美日韩xxx| 亚洲成在人线AⅤ中文字幕| 国产精品久久精品第一页| 国产大学生粉嫩无套流白浆| 谷城县| 亚洲自拍制服| 成人看的污污超级黄网站免费| 无码国产精品一区二区免费式直播| 国产三级精品三级在专区| 干日本少妇|