返回模型列表

Qwen: Qwen3 235B A22B Instruct 2507

qwen/qwen3-235b-a22b-2507
Jul 21, 2025262.1K 上下文$0.23/M in · $0.92/M out

描述

Qwen3-235B-A22B-Instruct-2507 是基于 Qwen3-235B 架构的多语言指令微调 Mixture-of-Experts 语言模型,每次前向传播激活 22B 参数。针对通用文本生成优化,涵盖指令遵循、逻辑推理、数学、代码与 tool usage。原生支持 262K context length,不启用 thinking 模式(不生成 <think> 块)。

相比基础版本,本版本在知识覆盖、长上下文推理、编码基准和开放式任务对齐上均有显著提升。在多语言理解、数学推理(如 AIME、HMMT)以及 Arena-Hard、WritingBench 等对齐评测上表现尤为出色。

技术规格

供应商
qwen
上下文长度
262.1K
最大输出
模态类型
输入text
输出text

定价

类型价格 / 百万 Token
输入$0.23
输出$0.92

快速开始

curl https://api.ominigate.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-omg-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-235b-a22b-2507",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'
Qwen: Qwen3 235B A22B Instruct 2507 — Pricing & API on OminiGate