返回模型列表
NVIDIA: Nemotron Nano 12B 2 VL
nvidia/nemotron-nano-12b-v2-vlOct 28, 2025131.1K 上下文$0.20/M in · $0.60/M out推理已弃用
此模型已被弃用
此模型已于 2026-05-07 弃用,不再可用于 API 调用。请迁移到替代模型。
描述
NVIDIA Nemotron Nano 2 VL 是一款参数量 120 亿的开放多模态推理模型,面向视频理解和文档智能场景。它引入混合 Transformer-Mamba 架构,将 transformer 级别的准确度与 Mamba 内存高效的序列建模相结合,显著提升吞吐并降低延迟。
模型支持文本和多图像文档输入,并生成自然语言输出。训练数据使用 NVIDIA 精选的高质量合成数据集,针对 OCR、图表推理和多模态理解做了优化。
Nemotron Nano 2 VL 在 OCRBench v2 上取得领先成绩,在 MMMU、MathVista、AI2D、OCRBench、OCR-Reasoning、ChartQA、DocVQA 和 Video-MME 等基准上平均得分约 74,优于此前的开放 VL 基线。借助 Efficient Video Sampling (EVS),它可处理长视频并降低推理成本。
开放权重、训练数据和微调配方在 NVIDIA 宽松开放许可下发布,并支持在 NeMo、NIM 及主流推理运行时上部署。
技术规格
供应商
nvidia
上下文长度
131.1K
最大输出
—
模态类型
输入imagetextvideo
输出text
定价
| 类型 | 价格 / 百万 Token |
|---|---|
| 输入 | $0.20 |
| 输出 | $0.60 |
快速开始
curl https://api.ominigate.ai/v1/chat/completions \
-H "Authorization: Bearer sk-omg-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "nvidia/nemotron-nano-12b-v2-vl",
"messages": [{"role": "user", "content": "Hello!"}]
}'