本文是LLM系列文章,针对《KNOWLEDGE SOLVER: TEACHING LLMS TO SEARCH FOR DOMAIN KNOWLEDGE FROM KNOWLEDGE GRAPHS》的翻译。
摘要
大型语言模型(LLM),如ChatGPT和GPT-4,由于其涌现能力和可推广性,是通用的,可以解决不同的任务。然而,LLM有时缺乏特定领域的知识来执行任务,这也会在推理过程中引起幻觉。在之前的一些工作中,图神经网络(GNN)等附加模块是根据从外部知识库中检索到的知识进行训练的,旨在缓解缺乏特定领域知识的问题。然而,合并额外的模块:1)当遇到新的领域时,需要重新训练额外的模块;2) 将成为一个瓶颈,因为LLM的强大能力没有完全用于检索。在本文中,我们提出了一种称为知识求解器(KSL)的范式,教LLM通过利用自身强大的可推广性,从外部知识库中搜索基本知识。具体来说,我们设计了一个简单而有效的提示,将检索转换为多跳决策序列,使LLM能够以零样本的方式搜索知识。此外,KSL能够提供完整的检索路径,从而提高LLM推理过程的可解释性。我们在三个数据集上进行了实验:CommonsenseQA、OpenbookQA和MedQA USMLEÿ