本文是LLM系列文章,针对《KnowTuning: Knowledge-aware Fine-tuning for Large Language Models》的翻译。
摘要
尽管大型语言模型在许多自然语言处理(NLP)任务中取得了成功,但它们仍然难以有效地利用知识进行知识密集型任务,表现出一些局限性,如生成不完整、非事实或不合逻辑的答案。这些限制源于在朴素精调过程中对LLM的知识认识不足。为了解决这些问题,我们提出了一种知识感知微调(KnowTuning)方法来显式和隐式地提高LLM的知识感知。我们设计了一个明确的知识感知生成阶段来训练LLM明确识别答案中的知识三元组。我们还提出了一个隐式知识感知比较阶段,以训练LLM在三个方面隐式区分可靠和不可靠知识:完整性、真实性和逻辑性。在通用和医学问答(QA)数据集上进行的大量实验证实了KnowTuning的有效性,通过对各种尺寸的LLM进行自动和人工评估。最后,我们证明了KnowTuning的改进可以推广到看不见的QA数据集。