【论文】【ACL2018】Neural Document Summarization by Jointly Learning to Score and Select Sentences

最新推荐文章于 2025-03-20 10:42:24 发布

codebrid

最新推荐文章于 2025-03-20 10:42:24 发布

阅读量1.2k

点赞数 1

分类专栏：论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ccbrid/article/details/102302140

版权

论文笔记专栏收录该内容

3 篇文章

订阅专栏

NeuSum是一种端到端的抽取式文本摘要模型，由Qingyu Zhou等研究者提出，解决了句子打分与选择割裂的问题，通过集成选择策略到打分模型中，实现了端到端的文本摘要生成，无需人为干预。该模型在CNN/DailyMail数据集上取得了state-of-the-art的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文题目：Neural Document Summarization by Jointly Learning to Score and Select Sentences.

论文作者：Qingyu Zhou, Nan Yang, Furu Wei, Shaohan Huang, Ming Zhou, Tiejun Zhao.

下载链接：https://aclweb.org/anthology/P18-1061

代码开源：https://github.com/magic282/NeuSum

太长不看版

本文提出了一种端到端的抽取式文本摘要模型(NEUSUM)。

该模型将选择策略集成到打分模型中，解决了此前抽取式文本摘要中句子打分和句子选择这两部分割裂的问题，端到端且不再需要人为干预。

并达到了 CNN/Daily Mail 数据集的 state-of-the-art。

主要思想

基于深度学习的抽取式摘要的方法基本分为以下四个步骤：句子编码、文章编码、句子打分、摘要选择。

这其中摘要选择部分的顺利进行依赖于句子可以很好的打分，然而在此前的研究方法句子打分与句子选择（即摘要选择）这两个环节常常被割裂开来。

本文针对这一现象，提出了一种端到端的抽取式文本摘要模型(NEUSUM)，将选择策略集成到打分模型中，解决了此前抽取式文本摘要中句子打分和句子选择这两部分割裂的问题，端到端且不再需要人为干预。并达到了 CNN/Daily Mail 的 state-of-the-art。

问题定义

抽取式摘要的目的在于抽取能够包含文章重要信息的句子，句子打分越高，其包含的信息越重要，越成为表示文章的摘要句。

本模型的训练目标即学到一个score function（打分函数）g，该函数计算加入当前句子后生成的摘要能得到的ROUGE F1的收益。

公式中函数 r 即表ROUGE F1。S表示当前句子与已经选出的句子集合。在每一个时间步 t，模型会选出能够得到最大收益（即使函数 g 得到最大值的句子）直至达到摘要限制长度。

模型结构

基于深度学习的抽取式摘要的方法基本分为以下四个步骤：句子编码、文章编码、句子打分、摘要选择。

1-2）Document & Sentence Encoding：句子编码、文章编码使用BiGRU

3-4）Sentence Scoring and Selection：句子打分、摘要选择融合到一起

融合到一起的好处：

a. 句子打分时可以看到前面句子的信息（前人方法的句子打分时句子间相对独立）

b. 打分函数 g 的存在简化了句子选择模块

句子打分的具体实现：

句子打分需要同时考虑当前句子的重要性和已经选出的summary，此处加入另一个GRU。在GRU之上连接句子打分器（scorer）。

The sentence scorer 是一个双层MLP，有两个输入向量：current hidden ht 和 sentence vector si。公式如下(有bias，为了简化在公式中省略)

损失函数：

Objective Function：KL-loss-function

数据构建

CNN/Daily Mail 是人为标注的生成式摘要的数据集。本文构建抽取式摘要训练数据的方法是 maximizing the ROUGE-2 F1 score。

数据预处理部分（包括sentence splitting, word tokenization）参照See et al. (2017), 使用非匿名版本。

CNN/Daily Mail 数据集统计如下表：

实验结果：

结论

本文的方法与以前的方法最大的不同之处在于，它将句子评分和选择结合成一个阶段。

每次选择一个句子，根据已输出摘要和当前状态对句子进行评分。

最终的ROUGE评价结果表明，本文提出的联合评分和选择方法明显优于以往的分离方法。

本文来自程序媛驿站，未经授权不得转载.

如有需要请公众号后台联系

（欢迎转发到朋友圈~）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。