返回模型列表

Z.ai: GLM 4.5

z-ai/glm-4.5
Jul 25, 2025131.1K 上下文98.3K 最大输出$0.60/M in · $2.20/M out推理

描述

GLM-4.5 是智谱最新的旗舰基础模型,专为 agent 类应用打造。采用 Mixture-of-Experts (MoE) 架构,支持最长 128k tokens 的 context window。GLM-4.5 在 reasoning、代码生成和 agent 对齐方面显著增强,支持混合推理模式:一种是面向复杂 reasoning 和 tool use 的 thinking mode,另一种是针对即时响应优化的 non-thinking mode。用户可通过 reasoning enabled 布尔参数控制 reasoning 行为,详见文档。

技术规格

供应商
z-ai
上下文长度
131.1K
最大输出
98.3K
模态类型
输入text
输出text

定价

类型价格 / 百万 Token
输入$0.60
输出$2.20
缓存读取$0.11

快速开始

curl https://api.ominigate.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-omg-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "z-ai/glm-4.5",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'