【无标题】

OptimaAI

于 2024-10-24 10:10:04 发布

阅读量737

点赞数 24

分类专栏： LLM论文日更文章标签： 1024程序员节

本文链接：https://blog.youkuaiyun.com/qq_59084968/article/details/143199465

版权

LLM论文日更专栏收录该内容

42 篇文章

订阅专栏

论文：https://arxiv.org/pdf/2410.04343
代码：未开源
机构：Google
领域：RAG
发表：arxiv

研究背景

研究问题：这篇文章研究了长上下文检索增强生成（RAG）中的推理扩展问题，特别是如何通过增加推理计算来提高RAG的性能。
研究难点：该问题的研究难点包括：如何在增加知识量的同时有效利用这些知识，以及如何在不增加上下文长度的情况下提高性能。
相关工作：相关研究主要集中在通过增加检索文档的数量或长度来扩展RAG的知识量，但这些方法在处理复杂查询时存在局限性。

研究的贡献如下：
        系统地研究了长上下文 RAG 的推理扩展，为此引入了两种扩展策略 DRAG 和 IterDRAG，以有效地扩展推理计算。
        • 全面评估了 DRAG 和 IterDRAG，它们不仅实现了最先进的性能，而且与单纯增加文档数量相比，还表现出卓越的扩展特性。
        • 在基准 QA 数据集上进行大量实验，证明了当测试时间计算得到最佳分配时，长上下文 RAG 性能可以随着计算预算数量级的增加而几乎线性地扩展。
        • 定量模拟了 RAG 性能与不同推理参数之间的关系，从而得出了计算分配模型。该模型与实验结果非常吻合，并且在各种场景中具有很好的泛化性，为长上下文 RAG 中的最佳计算分配提供了实用指导。

研究方法

这篇论文提出了两种推理扩展策略：演示基础RAG（DRAG）和迭代演示基础RAG（IterDRAG），用于解决长上下文RAG中的推理扩展问题。具体来说，

演示基础RAG（DRAG）：DRAG通过将多个RAG示例作为演示提供给长上下文LLM，使其能够在单个推理请求中生成答案。DRAG的输入提示包括文档和上下文示例，扩展了上下文长度以允许模型在单个请求中回答问题。
迭代演示基础RAG（IterDRAG）：IterDRAG通过将输入查询分解为更简单的子查询并使用交错检索来回答这些问题，从而处理复杂的多跳查询。IterDRAG在每次迭代中生成子查询、中间答案或最终答案，直到生成最终答案或达到最大迭代次数。