返回模型列表
Z.ai: GLM 4.5V
z-ai/glm-4.5vAug 11, 202565.5K 上下文16.4K 最大输出$0.60/M in · $1.80/M out推理
描述
GLM-4.5V 是面向 multimodal agent 应用的视觉语言基础模型。基于 Mixture-of-Experts (MoE) 架构,总参数 106B、激活参数 12B,在视频理解、图像问答、OCR 和文档解析上取得业界领先成绩,在前端网页代码生成、视觉 grounding 和空间 reasoning 方面也有明显提升。支持混合推理模式:用于深度 reasoning 的 thinking mode 和用于快速响应的 non-thinking mode。可通过 reasoning enabled 布尔参数切换 reasoning 行为,详见文档。
技术规格
供应商
z-ai
上下文长度
65.5K
最大输出
16.4K
模态类型
输入textimage
输出text
定价
| 类型 | 价格 / 百万 Token |
|---|---|
| 输入 | $0.60 |
| 输出 | $1.80 |
| 缓存读取 | $0.11 |
快速开始
curl https://api.ominigate.ai/v1/chat/completions \
-H "Authorization: Bearer sk-omg-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "z-ai/glm-4.5v",
"messages": [{"role": "user", "content": "Hello!"}]
}'