返回模型列表

NVIDIA: Nemotron Nano 12B 2 VL

nvidia/nemotron-nano-12b-v2-vl
Oct 28, 2025131.1K 上下文$0.20/M in · $0.60/M out推理已弃用

此模型已被弃用

此模型已于 2026-05-07 弃用,不再可用于 API 调用。请迁移到替代模型。

描述

NVIDIA Nemotron Nano 2 VL 是一款参数量 120 亿的开放多模态推理模型,面向视频理解和文档智能场景。它引入混合 Transformer-Mamba 架构,将 transformer 级别的准确度与 Mamba 内存高效的序列建模相结合,显著提升吞吐并降低延迟。

模型支持文本和多图像文档输入,并生成自然语言输出。训练数据使用 NVIDIA 精选的高质量合成数据集,针对 OCR、图表推理和多模态理解做了优化。

Nemotron Nano 2 VL 在 OCRBench v2 上取得领先成绩,在 MMMU、MathVista、AI2D、OCRBench、OCR-Reasoning、ChartQA、DocVQA 和 Video-MME 等基准上平均得分约 74,优于此前的开放 VL 基线。借助 Efficient Video Sampling (EVS),它可处理长视频并降低推理成本。

开放权重、训练数据和微调配方在 NVIDIA 宽松开放许可下发布,并支持在 NeMo、NIM 及主流推理运行时上部署。

技术规格

供应商
nvidia
上下文长度
131.1K
最大输出
模态类型
输入imagetextvideo
输出text

定价

类型价格 / 百万 Token
输入$0.20
输出$0.60

快速开始

curl https://api.ominigate.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-omg-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nvidia/nemotron-nano-12b-v2-vl",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'
NVIDIA: Nemotron Nano 12B 2 VL — Pricing & API on OminiGate