返回模型列表

Z.ai: GLM 4.5V

z-ai/glm-4.5v
Aug 11, 202565.5K 上下文16.4K 最大输出$0.60/M in · $1.80/M out推理

描述

GLM-4.5V 是面向 multimodal agent 应用的视觉语言基础模型。基于 Mixture-of-Experts (MoE) 架构,总参数 106B、激活参数 12B,在视频理解、图像问答、OCR 和文档解析上取得业界领先成绩,在前端网页代码生成、视觉 grounding 和空间 reasoning 方面也有明显提升。支持混合推理模式:用于深度 reasoning 的 thinking mode 和用于快速响应的 non-thinking mode。可通过 reasoning enabled 布尔参数切换 reasoning 行为,详见文档。

技术规格

供应商
z-ai
上下文长度
65.5K
最大输出
16.4K
模态类型
输入textimage
输出text

定价

类型价格 / 百万 Token
输入$0.60
输出$1.80
缓存读取$0.11

快速开始

curl https://api.ominigate.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-omg-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "z-ai/glm-4.5v",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'