传统 RAG 方法通常只在生成前执行一次检索,这在处理复杂查询时效果有限。微软&人大提出了一种用于训练o1-like的RAG模型的方法CoRAG,在生成最终答案之前逐步检索并推理相关信息。
CoRAG(Chain-of-Retrieval Augmented Generation) 的核心在于通过 拒绝采样(rejection sampling) 自动生成中间检索链,从而扩展现有的 RAG 数据集。每个检索链由一系列子查询和子答案组成,模型通过逐步检索和推理来逐步接近最终答案。
CoRAG概览。利用拒绝采样为仅包含问答对的数据集增加检索链。每条链从原始查询开始,随后是一系列子查询和子答案。然后对开源的大型语言模型(LLM)进行微调,以基于当前状态预测下一步操作。在推理过程中,提供了多种解码策略来控制测试时的计算量。
-
检索链生成:通过拒绝采样生成中间检索链,每个链由子查询和子答案组成。模型根据当前状态动态生成新的子查询,并通过检索获取子答案。
-
模型训练:使用增强后的数据集对开源语言模型进行微调。训练任务包括子查询预测、子答案预测和最终答案预测。
-
测试时解码策略:提出多种解码策略(如贪婪解码、最佳采样和树搜索)来控制测试时的计算量,通过调整检索链长度和采样数量来平衡性能和计算成本。
实验评估了 CoRAG 在多个基准测试中的表现,包括多跳问答数据集(如 2WikiMultihopQA、HotpotQA 和 MuSiQue)和 KILT 基准测试(涵盖多种知识密集型任务)。
-
多跳问答任务:CoRAG 在这些任务中表现优异,与强大的基线模型相比,EM(Exact Match)分数提高了超过 10 个百分点。例如,在 MuSiQue 数据集中,CoRAG 的 EM 分数达到了 72.5%,显著优于其他模型。
-
KILT 基准测试:CoRAG 在几乎所有任务上都取得了新的最佳性能,尤其是在需要复杂推理的任务中。例如,在 FEVER 任务中,CoRAG 的准确率达到了 93.1%,接近甚至超过了部分参数量更大的模型。
CoRAG 模型在测试时可以通过增加检索链长度和采样数量来显著提升性能,尤其是在处理复杂推理任务时。然而,这种提升存在边际效应,且不同数据集的扩展行为存在显著差异。
HotpotQA数据集验证集中的示例。为简洁起见,每一步检索到的文档均已省略。正确答案以蓝色突出显示,错误答案以红色突出显示。
https://arxiv.org/pdf/2501.14342
Chain-of-Retrieval Augmented Generation
如何系统学习掌握AI大模型?
AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。
学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。
这里给大家精心整理了一份
全面的AI大模型学习资源
,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享
!
1. 成长路线图&学习规划
要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。
这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
2. 大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)
3. 大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。
4. 2024行业报告
行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。
5. 大模型项目实战
学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。
6. 大模型面试题
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以
微信扫描下方优快云官方认证二维码
,免费领取【保证100%免费
】