GLM-4.5V 現已發布
多模態,支持圖像、視頻輸入
(成績如圖)
在「開源多模態」賽道中
42 個榜單,41 個 sota
MoE 架構,106B總參數,12B激活
以 MIT 形式開源
API 輸入2元/輸出6元(百萬tokens)
速度:60-80 tokens/s
基模GLM-4.5-Air
延續 GLM-4.1V 路線
視覺編碼器+MLP適配器+語言解碼器
用了三維旋轉位置編碼(3D-RoPE)
預訓練→SFT→RL三段訓練
- SFT 引入顯式思維鏈
- RL 階段結合 RLVR & RLHF
- 優化了 STEM、多模態、Agent 任務
GitHub:
https://github.com/zai-org/GLM-V
Hugging Face:
https://huggingface.co/collections/zai-org/glm-45v
魔搭社區:
https://modelscope.cn/collections/GLM-45V
網頁應用
在 www.z.ai,直接使用 GLM-4.5V
API
在 BigModel.cn 可領 2000 萬資源包
日常調用(百萬tokens):輸入2元,輸出6元
最后:坐等 355B 版本的多模態
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.