TTD-DR:基于测试时(Test-Time)扩散的深度研究Agent突破

谷歌在扩散技术领域持续发力。这次,他们将扩散技术应用于深度研究agent,专门用于优化研究报告生成过程。该方法在长篇研究任务中对比OpenAI Deep Research取得了69.1%的胜率。

谷歌在扩散技术领域持续发力。这次,他们将扩散技术应用于深度研究agent,专门用于优化研究报告生成过程。该方法在长篇研究任务中对比OpenAI Deep Research取得了69.1%的胜率。

图片

图片

论文提出了测试时扩散深度研究员(TTD-DR),重新思考了深度研究agent生成长篇报告的方式。TTD-DR没有依赖传统的静态推理策略(如思维链或最优N选择采样),而是将报告生成过程构建为扩散过程——从噪声草稿开始,通过检索增强的去噪过程进行迭代优化,并由结构化计划进行指导。

图片

图片

以草稿为骨架 TTD-DR从初步报告草稿和研究计划开始。这个不断演进的框架会指导应该发起哪些搜索查询,以及如何整合新信息,从而在研究生成过程中提升连贯性和时效性。

图片

图片

基于检索的去噪 噪声草稿通过类似扩散的方式反复修订,每个步骤都包括发起新的搜索查询、整合检索到的内容并更新草稿。这个循环持续到收敛为止,确保外部知识的及时融入。

组件级自进化 研究工作流程中的每个单元(计划生成、查询构建、答案综合、最终写作)都有自己的优化循环。这种进化使用了多变体采样、LLM评判打分、基于批评的修订以及交叉合并等技术来选择高适应性的输出。

卓越成果 在五个基准测试(LongForm Research、DeepConsult、HLE-Search、HLE-Full和GAIA)中,TTD-DR始终优于来自OpenAI、Perplexity和Grok的agent。例如,在长篇生成任务中对比OpenAI Deep Research达到69.1%的胜率,在短篇多跳问答任务中获得4.8%至7.7%的提升。

图片

图片

高效扩展 与仅使用骨架和仅使用自进化的变体相比,完整的TTD-DR系统实现了最优的性能/延迟权衡,表明基于检索的去噪是一种高效的测试时扩展策略。

这又是一篇将扩散、自进化算法和结构化规划等理念巧妙结合的优秀论文,为构建更先进的长篇研究报告生成agent提供了新思路。

AI大模型学习福利

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。


因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获

四、AI大模型商业化落地方案

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值