ICLR2024 spotlight文章！革新AI文本生成：模型算术实现精细控制，降低文本毒性

原创

于 2024-05-17 23:37:33 发布 · 1.2k 阅读

·

22

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

DeepVisionary 每日深度学习前沿科技推送&顶会论文分享，与你一起了解前沿深度学习信息！

引言：探索语言模型的定制化控制

在现代人工智能的应用中，语言模型扮演了至关重要的角色。随着大型语言模型（LLMs）的广泛部署，对于词汇、风格和特征的定制化控制变得愈发重要。本文介绍了一种新颖的推理框架——模型算术，它允许在不需要模型重新训练或高度特定数据集的情况下，组合和偏置LLMs。此外，该框架比直接提示和以往的控制文本生成（CTG）技术能更精确地控制生成文本。通过模型算术，我们能够将之前的CTG技术表达为简单的公式，并自然地扩展它们以形成新的、更有效的公式。此外，我们展示了推测性采样技术在我们的设置中的扩展，这使得在多个组合模型上进行高效的文本生成成为可能，且仅比单一模型略有开销。我们的实证评估表明，模型算术允许对生成文本进行细粒度控制，并在降低文本毒性的任务上超越了最先进的技术。

论文基本信息

标题: Controlled Text Generation via Language Model Arithmetic
作者: Jasper Dekoninck, Marc Fischer, Luca Beurer-Kellner, Martin Vechev
链接: https://arxiv.org/pdf/2311.14479.pdf

模型算术的介绍与定义

模型

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。