![]()
哈嘍,大家好,今天小墨這篇評論,主要來分析智譜GLM-4.6V開源爆火,性能驚艷卻藏小遺憾。
AI圈剛炸了個大消息,智譜毫無預兆地把重磅多模態大模型GLM-4.6V系列開源了。這波操作直接讓不少開發者連夜蹲守下載,畢竟能免費用到接近頂尖水準的模型,放在以前想都不敢想。
更讓人意外的是,連去年就火過一把的AutoGLM智能體也同步開源。這款被業內視為“全球首個具備手機操作能力的AI Agent”的工具,功能類似剛發布技術預覽版的豆包手機助手,這下普通用戶也能上手體驗了。
![]()
![]()
這次智譜一次性放出兩個版本的GLM-4.6V模型,針對性做得很明確。基礎版GLM-4.6V(106B-A12B)主打云端和高性能集群場景,輕量版GLM-4.6V-Flash(9B)則適合本地部署,滿足低延遲應用需求。
最關鍵的是價格誠意,GLM-4.6V系列比上一代GLM-4.5V降價50%,API調用輸入僅1元/百萬tokens,輸出3元/百萬tokens。輕量版更直接全面免費,這對個人開發者和小團隊來說,簡直是降維福利。
![]()
值得一提的是,AutoGLM的開源也填補了手機端AI Agent的開源空白。每日經濟新聞12月1日報道,字節跳動剛發布豆包手機助手技術預覽版,主要和手機廠商合作推進。
![]()
而AutoGLM作為更早出現的同類工具,如今開源后,開發者或許能基于它做出更多個性化的手機助手功能。
![]()
9B版本的GLM-4.6V-Flash在34項測試中,有22項分數超過了Qwen3-VL-8B。106B參數12B激活的基礎版更厲害,表現和參數量是它兩倍的Qwen3-VL-235B不相上下。
![]()
![]()
在視頻理解方面表現也很穩定,上傳一段6分48秒的視頻制作技巧分享視頻,幾秒鐘內就能解析出視頻思路、敘事技巧和鏡頭運用方式,還能給出成為攝影博主的建議。
![]()
![]()
![]()
比如測試網頁復刻功能時,讓它把X平臺登錄頁面的圖標X改為Z,模型卻誤生成了向上箭頭的形狀。
![]()
不過好在常規功能都很穩定,像識圖購物比價功能,輸入“搜索iPhone 17 Pro Max各平臺價格”,就能自動生成包含商品鏈接的比價表格,點擊就能跳轉購買。
有電商從業者嘗試用它搜索《瘋狂動物城2》中尼克狐的同款眼鏡,模型通過圖像搜索功能,很快就找出了同款眼鏡的實拍圖,精準度還是值得肯定的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.