返回模型列表

NVIDIA: Llama 3.1 Nemotron 70B Instruct

nvidia/llama-3.1-nemotron-70b-instruct
Oct 15, 2024131.1K 上下文16.4K 最大输出$1.20/M in · $1.20/M out已弃用

此模型已被弃用

此模型已于 2026-05-07 弃用,不再可用于 API 调用。请迁移到替代模型。

描述

NVIDIA 的 Llama 3.1 Nemotron 70B 是一款用于生成精确且有用响应的语言模型。该模型基于 Llama 3.1 70B 架构,结合 Reinforcement Learning from Human Feedback (RLHF),在自动对齐基准测试中表现出色。适合对帮助性和响应生成准确度要求较高的应用,可覆盖多领域的各类用户查询。

使用该模型须遵守 Meta 可接受使用政策

技术规格

供应商
nvidia
上下文长度
131.1K
最大输出
16.4K
模态类型
输入text
输出text

定价

类型价格 / 百万 Token
输入$1.20
输出$1.20

快速开始

curl https://api.ominigate.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-omg-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nvidia/llama-3.1-nemotron-70b-instruct",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'