返回模型列表
Tongyi DeepResearch 30B A3B
alibaba/tongyi-deepresearch-30b-a3bSep 18, 2025131.1K 上下文131.1K 最大输出$0.09/M in · $0.45/M out推理
描述
Tongyi DeepResearch 是阿里通义实验室研发的 agentic 大语言模型,总参数 30B、每 token 仅激活 3B。模型面向长程、深度信息检索类任务优化,在 Humanity's Last Exam、BrowserComp、BrowserComp-ZH、WebWalkerQA、GAIA、xbench-DeepSearch、FRAMES 等基准上表现较强,在复杂 agentic 检索、推理与多步问题求解方面相较此前模型更具优势。
模型配套全自动合成数据流水线,可扩展用于预训练、微调与强化学习;通过在多样化 agentic 数据上进行大规模持续预训练提升推理能力并保持数据新鲜度。端到端的 on-policy RL 采用定制的 Group Relative Policy Optimization,包含 token 级梯度与负样本过滤以稳定训练。模型支持 ReAct 做基础能力验证,以及基于 IterResearch 的 Heavy 模式,通过测试时扩展追求更高性能,适用于进阶研究 agent、工具使用与高负载推理工作流。
技术规格
供应商
alibaba
上下文长度
131.1K
最大输出
131.1K
模态类型
输入text
输出text
定价
| 类型 | 价格 / 百万 Token |
|---|---|
| 输入 | $0.09 |
| 输出 | $0.45 |
| 缓存读取 | $0.09 |
快速开始
curl https://api.ominigate.ai/v1/chat/completions \
-H "Authorization: Bearer sk-omg-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "alibaba/tongyi-deepresearch-30b-a3b",
"messages": [{"role": "user", "content": "Hello!"}]
}'