DeepVisionary 每日深度学习前沿科技推送&顶会论文分享,与你一起了解前沿深度学习信息!
引言:探索语言模型的定制化控制
在现代人工智能的应用中,语言模型扮演了至关重要的角色。随着大型语言模型(LLMs)的广泛部署,对于词汇、风格和特征的定制化控制变得愈发重要。本文介绍了一种新颖的推理框架——模型算术,它允许在不需要模型重新训练或高度特定数据集的情况下,组合和偏置LLMs。此外,该框架比直接提示和以往的控制文本生成(CTG)技术能更精确地控制生成文本。通过模型算术,我们能够将之前的CTG技术表达为简单的公式,并自然地扩展它们以形成新的、更有效的公式。此外,我们展示了推测性采样技术在我们的设置中的扩展,这使得在多个组合模型上进行高效的文本生成成为可能,且仅比单一模型略有开销。我们的实证评估表明,模型算术允许对生成文本进行细粒度控制,并在降低文本毒性的任务上超越了最先进的技术。
论文基本信息
- 标题: Controlled Text Generation via Language Model Arithmetic
- 作者: Jasper Dekoninck, Marc Fischer, Luca Beurer-Kellner, Martin Vechev
- 链接: https://arxiv.org/pdf/2311.14479.pdf

模型算术的介绍与定义
模型

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



