返回模型列表
NVIDIA: Nemotron 3 Super
nvidia/nemotron-3-super-120b-a12bMar 11, 2026262.1K 上下文$0.09/M in · $0.45/M out推理
描述
NVIDIA Nemotron 3 Super 是一款 120B 参数的开放混合 MoE 模型,仅激活 12B 参数即可在复杂多 agent 应用中兼顾计算效率与准确度。其基于混合 Mamba-Transformer Mixture-of-Experts 架构,配合多 token 预测(MTP),token 生成吞吐较领先开放模型提升 50% 以上。
模型具备 1M tokens 的 context window,可支持长期 agent 一致性、跨文档推理和多步任务规划。Latent MoE 仅以单个专家的推理成本调用 4 个专家,提升模型智能与泛化能力。跨 10 多个环境的多环境 RL 训练,使其在 AIME 2025、TerminalBench、SWE-Bench Verified 等基准上获得领先精度。
Nemotron 3 Super 依据 NVIDIA Open License 完整开放权重、数据集与训练配方,便于定制并在任何环境(从工作站到云端)上安全部署。
技术规格
供应商
nvidia
上下文长度
262.1K
最大输出
—
模态类型
输入text
输出text
定价
| 类型 | 价格 / 百万 Token |
|---|---|
| 输入 | $0.09 |
| 输出 | $0.45 |
快速开始
curl https://api.ominigate.ai/v1/chat/completions \
-H "Authorization: Bearer sk-omg-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "nvidia/nemotron-3-super-120b-a12b",
"messages": [{"role": "user", "content": "Hello!"}]
}'