返回模型列表
Z.ai: GLM 4.6V
z-ai/glm-4.6vDec 8, 2025131.1K 上下文131.1K 最大输出$0.30/M in · $0.90/M out推理
描述
GLM-4.6V 是一款大型 multimodal 模型,面向图像、文档和混合媒体中的高保真视觉理解与长上下文 reasoning。支持最长 128K tokens,可直接以视觉输入处理复杂的页面布局和图表,并内置原生 multimodal function calling,将感知与下游 tool use 打通。模型还支持图文交错生成和 UI 重建工作流,包括从截图合成 HTML 以及迭代式的视觉编辑。
技术规格
供应商
z-ai
上下文长度
131.1K
最大输出
131.1K
模态类型
输入imagetextvideo
输出text
定价
| 类型 | 价格 / 百万 Token |
|---|---|
| 输入 | $0.30 |
| 输出 | $0.90 |
| 缓存读取 | $0.05 |
快速开始
curl https://api.ominigate.ai/v1/chat/completions \
-H "Authorization: Bearer sk-omg-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "z-ai/glm-4.6v",
"messages": [{"role": "user", "content": "Hello!"}]
}'