返回模型列表
Z.ai: GLM 4.5
z-ai/glm-4.5Jul 25, 2025131.1K 上下文98.3K 最大输出$0.60/M in · $2.20/M out推理
描述
GLM-4.5 是智谱最新的旗舰基础模型,专为 agent 类应用打造。采用 Mixture-of-Experts (MoE) 架构,支持最长 128k tokens 的 context window。GLM-4.5 在 reasoning、代码生成和 agent 对齐方面显著增强,支持混合推理模式:一种是面向复杂 reasoning 和 tool use 的 thinking mode,另一种是针对即时响应优化的 non-thinking mode。用户可通过 reasoning enabled 布尔参数控制 reasoning 行为,详见文档。
技术规格
供应商
z-ai
上下文长度
131.1K
最大输出
98.3K
模态类型
输入text
输出text
定价
| 类型 | 价格 / 百万 Token |
|---|---|
| 输入 | $0.60 |
| 输出 | $2.20 |
| 缓存读取 | $0.11 |
快速开始
curl https://api.ominigate.ai/v1/chat/completions \
-H "Authorization: Bearer sk-omg-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "z-ai/glm-4.5",
"messages": [{"role": "user", "content": "Hello!"}]
}'