让AI真正“能做研究”,通义DeepResearch模型、框架、方案全开源
IT之家 9 月 17 日消息,阿里通义实验室今日宣布,为了让 AI 真正具备“做研究”的能力,针对通义 DeepResearch 的数据、Agent 范式、训练、基础设施(Infra)、Test Time Scaling 进行了系统性创新,并宣布所有技术方案均已开源。
根据介绍,通义 DeepResearch“不是简单的资料堆叠”,而是围绕一个问题完成一个完整的“研究闭环”,通过深度搜寻-多源交叉-结构化归纳-报告生成来产出有引用、可复现的调研报告与决策建议。
在 Humanity's Last Exam、BrowseComp、GAIA、xbench-DeepSearch、WebWalkerQA 五个权威 Benchmark 上,通义 DeepResearch Agent 30B-A3B 轻量级达到了 SOTA 效果。官方表示,团队对深度研究型智能体的推理范式进行了广泛的探索,因此最终模型支持多种推理形式,包括原生的 ReAct 模式和上下文管理的深度模式。
目前,通义 DeepResearch 已经赋能多个阿里巴巴内部应用,真实落地案例包括高德地图、通义法睿两款应用。
通义 DeepResearch 与高德地图深度共建,联合推出全球首个 AI 原生出行 Agent。
该 Agent 为高德预置了专属地图 API、实时天气查询、交通状况监测等工具,可结合当下情况为用户提供更准确的行动建议。例如,在即将晚高峰的时候导航去机场,高德地图可制定绕开一条避开拥堵路线的方案。
在对专业性、准确性要求极高的法律领域,通义 DeepResearch 同样表现出色。我们将其能力注入“通义法睿”,打造了专为法律研究优化的智能体。它能自动检索法条、类案和裁判文书,并进行深度归纳分析。在与 OpenAI、Claude 等国际顶尖模型的同台竞技中,通义法睿在“法条引用相关性”和“案例引用相关性”两项关键指标上全面领先,综合表现最优。这不仅验证了通义大模型在复杂推理场景的硬实力,更为法律从业者提供了强大的生产力工具。
(来源:新浪科技)