返回模型列表

Tongyi DeepResearch 30B A3B

alibaba/tongyi-deepresearch-30b-a3b
Sep 18, 2025131.1K 上下文131.1K 最大输出$0.09/M in · $0.45/M out推理

描述

Tongyi DeepResearch 是阿里通义实验室研发的 agentic 大语言模型,总参数 30B、每 token 仅激活 3B。模型面向长程、深度信息检索类任务优化,在 Humanity's Last Exam、BrowserComp、BrowserComp-ZH、WebWalkerQA、GAIA、xbench-DeepSearch、FRAMES 等基准上表现较强,在复杂 agentic 检索、推理与多步问题求解方面相较此前模型更具优势。

模型配套全自动合成数据流水线,可扩展用于预训练、微调与强化学习;通过在多样化 agentic 数据上进行大规模持续预训练提升推理能力并保持数据新鲜度。端到端的 on-policy RL 采用定制的 Group Relative Policy Optimization,包含 token 级梯度与负样本过滤以稳定训练。模型支持 ReAct 做基础能力验证,以及基于 IterResearch 的 Heavy 模式,通过测试时扩展追求更高性能,适用于进阶研究 agent、工具使用与高负载推理工作流。

技术规格

供应商
alibaba
上下文长度
131.1K
最大输出
131.1K
模态类型
输入text
输出text

定价

类型价格 / 百万 Token
输入$0.09
输出$0.45
缓存读取$0.09

快速开始

curl https://api.ominigate.ai/v1/chat/completions \
  -H "Authorization: Bearer sk-omg-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "alibaba/tongyi-deepresearch-30b-a3b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'
Tongyi DeepResearch 30B A3B — Pricing & API on OminiGate