本文是LLM系列文章,针对《Unlearn What You Want to Forget: Efficient Unlearning for LLMs》的翻译。
摘要
大型语言模型(LLM)在对各种文本数据进行预训练和记忆方面取得了重大进展,然而,这一过程可能会受到隐私问题和违反数据保护法规的影响。因此,从这样的模型中容易地删除与个人用户相关的数据,同时在删除后不恶化其预测质量的能力变得越来越重要。为了解决这些问题,在这项工作中,我们提出了一个有效的遗忘框架,通过在Transformer中引入以选择性师生目标学习的轻量级遗忘层,该框架可以有效地更新LLM,而不必在数据删除后对整个模型进行再训练。此外,我们引入了一种融合机制来有效地组合不同的遗忘层,学习遗忘不同的数据集来处理一系列遗忘操作。分类和生成任务的实验表明,与最先进的基线相比,我们提出的方法是有效的。
1 引言
2 相关工作
3 LLM的高效遗忘
4 实验
5 结论
在这项工作中,我们提出了EUL,这是一种有效的LLM遗忘方法,它可以通过选择性教师-学生目标学习遗忘层来有效地遗忘用户请求的数据。我们进一步引入了一种融合机制,可以将不同的遗忘层合并为一个统一的层,以动态地遗忘数据序列。在不同设置(不同的数据集、不同的模型大小、不同的遗忘集大小)上的实验证明了与最先进的基线相比,我们提出的EUL方法的有效性。