本文是LLM系列文章,针对《Self-Retrieval: Building an Information Retrieval System with
One Large Language Model》的翻译。
摘要
大型语言模型(LLM)的兴起已经改变了信息检索(IR)系统在人类获取信息方面的作用。由于孤立的体系结构和有限的交互,现有的IR系统无法完全适应从直接向人类提供信息到间接为大型语言模型服务的转变。在本文中,我们提出了自检索,这是一种端到端的LLM驱动的信息检索架构,可以将IR系统所需的能力完全内化为单个LLM,并在IR过程中深度利用LLM的能力。具体来说,自检索通过自然语言索引架构将语料库内化为LLM。然后,整个检索过程被重新定义为文档生成和自我评估的过程,可以使用单个大型语言模型端到端地执行。实验结果表明,自检索不仅大大优于以前的检索方法,而且可以显著提高LLM驱动的下游应用程序(如检索预测生成)的性能。
1 引言
2 相关工作
3 LLM的自检索
4 学习
5 实验
6 结论
在本文中,我们提出了一种端到端LLM驱动的信息检索架构——SelfRetrieval。自检索由三个基本组成部分组成:索引、检索和自评估,这允许仅使用一个LLM完成整个检索任务。通过这种方式,语料库被内化到LLM中,并可以由其直接生

订阅专栏 解锁全文

1927

被折叠的 条评论
为什么被折叠?



