本文是LLM系列文章,针对《KnowTuning: Knowledge-aware Fine-tuning for Large Language Models》的翻译。
摘要
尽管大型语言模型在许多自然语言处理(NLP)任务中取得了成功,但它们仍然难以有效地利用知识进行知识密集型任务,表现出一些局限性,如生成不完整、非事实或不合逻辑的答案。这些限制源于在朴素精调过程中对LLM的知识认识不足。为了解决这些问题,我们提出了一种知识感知微调(KnowTuning)方法来显式和隐式地提高LLM的知识感知。我们设计了一个明确的知识感知生成阶段来训练LLM明确识别答案中的知识三元组。我们还提出了一个隐式知识感知比较阶段,以训练LLM在三个方面隐式区分可靠和不可靠知识:完整性、真实性和逻辑性。在通用和医学问答(QA)数据集上进行的大量实验证实了KnowTuning的有效性,通过对各种尺寸的LLM进行自动和人工评估。最后,我们证明了KnowTuning的改进可以推广到看不见的QA数据集。
1 引言
2 相关工作
3 方法
4 实验
5 实验结果与分析
6 结论
在本文中,我们专注于通过对知识密集型任务的微调来提高LLM的知识意识。我们提出了KnowTuning,通过显式知识感知生成和隐式知识感知比较阶段来微调LLM。我们在通用和医学领域的QA数据集上进行了全面的实验,通过各种规模的LLM的自动和人工评估证明了KnowTuning的有效性。此外,我们已经表明,使用KnowTuning实现的改进可以推广到看不见的QA数据集。我们的代码和数据集在

本文提出了一种名为KnowTuning的方法,针对大型语言模型在知识密集型任务中的局限性,通过显式知识感知生成和隐式知识感知比较阶段进行微调,以增强其知识理解和应用能力。在多个问答数据集上的实验显示了该方法的有效性,并且改进效果可推广到未见过的数据集。
已下架不支持订阅
1356

被折叠的 条评论
为什么被折叠?



