ICLR2024 spotlight文章!革新AI文本生成:模型算术实现精细控制,降低文本毒性

DeepVisionary 每日深度学习前沿科技推送&顶会论文分享,与你一起了解前沿深度学习信息!

引言:探索语言模型的定制化控制

在现代人工智能的应用中,语言模型扮演了至关重要的角色。随着大型语言模型(LLMs)的广泛部署,对于词汇、风格和特征的定制化控制变得愈发重要。本文介绍了一种新颖的推理框架——模型算术,它允许在不需要模型重新训练或高度特定数据集的情况下,组合和偏置LLMs。此外,该框架比直接提示和以往的控制文本生成(CTG)技术能更精确地控制生成文本。通过模型算术,我们能够将之前的CTG技术表达为简单的公式,并自然地扩展它们以形成新的、更有效的公式。此外,我们展示了推测性采样技术在我们的设置中的扩展,这使得在多个组合模型上进行高效的文本生成成为可能,且仅比单一模型略有开销。我们的实证评估表明,模型算术允许对生成文本进行细粒度控制,并在降低文本毒性的任务上超越了最先进的技术。

论文基本信息

  • 标题: Controlled Text Generation via Language Model Arithmetic
  • 作者: Jasper Dekoninck, Marc Fischer, Luca Beurer-Kellner, Martin Vechev
  • 链接: https://arxiv.org/pdf/2311.14479.pdf
    在这里插入图片描述

模型算术的介绍与定义

模型

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值