本文是LLM系列文章,针对《Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity》的翻译。
摘要
检索增强大语言模型(LLM)将外部知识库中的非参数知识整合到LLM中,已成为提高多项任务(如问答)响应准确性的一种很有前途的方法。然而,即使有各种方法处理不同复杂性的查询,它们要么处理具有不必要的计算开销的简单查询,要么不能充分处理复杂的多步骤查询;然而,并不是所有的用户请求都只属于简单或复杂类别中的一类。在这项工作中,我们提出了一种新的自适应QA框架,该框架可以根据查询复杂性从最简单到最复杂的LLM动态选择最适合(检索增强)LLM的策略。此外,这个选择过程是用分类器来操作的,分类器是一个较小的LM,它被训练来预测具有自动收集标签的传入查询的复杂性水平,这些标签是从模型的实际预测结果和数据集中固有的归纳偏差中获得的。这种方法提供了一种平衡的策略,可以在迭代和单步检索增强的LLM以及noretrieval方法之间无缝调整,以应对一系列查询复杂性。我们在一组涵盖多个查询复杂性的开放域QA数据集上验证了我们的模型,并表明与包括自适应检索方法在内的相关基线相比,我们的模型提高了QA系统的整体效率和准确性。代码位于&#