Training language models to follow instructions with human feedback
LLMs之InstructGPT:《Training language models to follow instructions with human feedback》翻译与解读
https://arxiv.org/pdf/2203.02155
b站视频:https://www.bilibili.com/video/BV17Bc9e6EzG/
文章目录
摘要
这篇论文的目标是通过引入一种基于人类反馈的训练方法,来让语言模型更好地按照用户意图行事。这是因为大规模语言模型虽然强大,但有时候会生成不准确、有偏见或者对用户无帮助的内容,这说明它们和用户的需求之间存在一定的“错位”。论文提出了一个新方法,将 GPT-3 进行优化ÿ