自然语言生成中的幻觉控制技术
在自然语言生成过程中,程序必须对如何表达信息做出选择,包括确定要传达的内容、使用的词语以及词语排序以形成句子。深度学习能够生成非常流畅的文本,但通常无法基于指定的输入目标来控制这些选择的方式。
可控语言生成的一个主要关注点是输出应该忠实于输入。神经语言生成方法已知会产生内容幻觉,导致生成的文本传达输入中未出现的信息。模型幻觉导致的事实不一致可能发生在实体层面或关系层面。
在实体层面,模型生成的摘要可能包含源文档中完全不存在实体。还存在另一种更难以发现的幻觉类型:关系不一致,即实体存在于源文档中,但这些实体之间的关系却不存在。
当前依赖大规模语言模型的自然语言生成技术能够生成流畅文本,但难以通过控制词语选择或词语顺序来保证说话者意图准确传达。详细技术可使模型忠实呈现说话者意图。
数据增强与忠实生成技术
幻觉发生的一种方式是训练数据不包含训练期间输入中出现的数据或短语。忠实生成和摘要的方法主要依赖数据增强技术。
对于从数据生成语言,使用自训练方法增强原始训练数据,实例由结构化数据对和传达信息的相关文本组成,每个实例都是全新的。
值得注意的是,在使用增强数据训练后,即使是带有贪婪解码的简单编码器-解码器模型,也能生成语义正确的话语,在自动和人工质量评估中与最先进输出相当。
还研究了神经序列到序列模型在执行从意义表示进行自然语言生成时表现出的细粒度可控性程度,特别是控制词序的影响。
假设有一个意义表示,给出餐厅名称、位置和供应的食物类型。句子可以排序信息,使餐厅名称首先出现,或者将食物放在餐厅名称和位置之前,或者从提供位置开始。
可以想象不同排序更合适的场景。例如,假设有人问“我在哪里可以找到喝咖啡的好地方?”,回复的重点可能是位置。然而,对于“Café Aramis在哪里?它供应什么?”这样的问题,预计回复以“Café Aramis”开头。
系统比较了四种输入线性化策略对可控性和忠实性的影响。线性化指的是找到给定词语集合的正确语法顺序的任务。还使用数据增强来提高性能。发现,在训练期间正确对齐输入序列可实现高度可控的生成,无论是从头开始训练还是微调更大的预训练模型时。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码

9159

被折叠的 条评论
为什么被折叠?



