返回模型列表
Qwen: Qwen3 VL 32B Instruct
qwen/qwen3-vl-32b-instructOct 23, 2025131.1K 上下文32.8K 最大输出$0.16/M in · $0.64/M out
描述
Qwen3-VL-32B-Instruct 是大规模 vision-language 多模态模型,专为文本、图像、视频的高精度理解与推理设计。320 亿参数将深度视觉感知与高级文本理解相结合,可完成细粒度空间推理、文档与场景分析以及长时视频理解。支持 32 种语言的稳健 OCR,通过 Interleaved-MRoPE 和 DeepStack 架构增强多模态融合。针对 agentic 交互和视觉 tool use 进行优化,在复杂真实世界多模态任务上提供 state-of-the-art 性能。
技术规格
供应商
qwen
上下文长度
131.1K
最大输出
32.8K
模态类型
输入textimage
输出text
定价
| 类型 | 价格 / 百万 Token |
|---|---|
| 输入 | $0.16 |
| 输出 | $0.64 |
快速开始
curl https://api.ominigate.ai/v1/chat/completions \
-H "Authorization: Bearer sk-omg-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3-vl-32b-instruct",
"messages": [{"role": "user", "content": "Hello!"}]
}'