来源:
Arxiv, 2018
关键词:
PGNet; mixture coefficient; Decoding
问题:
现有生成式摘要系统(主要指PGNet)抽取性过高。
模型:
对解码过程进行控制,将生成模式和拷贝模式的混合系数(mixture coefficient)作为一个额外的优化目标。
原得分函数:
为了解决训练过程和解码过程中混合系数差别较大的问题,提出一个新的得分函数:
m*是目标混合系数,后一个是当前步的平均值。这样可以排除与目标系数差别过大的情况。
简评:
这篇文章的实验结果ROUGE得分并没有超越See etal. (2017)那篇,但其在控制生成式文摘系统抽取性方面做出的努力是值得肯定的。