Re4：读论文 CGSum: Enhancing Scientific Papers Summarization with Citation Graph

原创已于 2022-04-01 22:42:50 修改 · 733 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#自然语言处理 #深度学习 #神经网络 #GNN #CGSum

于 2021-08-26 16:59:12 首次发布

人工智能学习笔记专栏收录该内容

279 篇文章

订阅专栏

该博客介绍了AAAI2021会议上的一篇论文，研究如何利用GNN改进科学论文摘要生成。CGSum模型结合了文献内容和引用关系，通过BiLSTM和GAT构建encoder-decoder框架，处理文献引用图。实验表明，考虑引用关系能提升摘要质量。此外，文章还提供了公开数据集SSN和代码实现。

诸神缄默不语-个人优快云博文目录

论文下载地址：2104.03057.pdf

代码：ChenxinAn-fdu/CGSum: code and dataset for AAAI 2021 paper: Enhancing Scientific Papers Summarization with Citation Graph

这篇是发在AAAI2021上的NLP领域的文章，使用了GNN的方法。因为我之前是学GNN的，所以这篇论文其实没太看懂，仅此记载概述。

1. 模型构造思路

本文的两大贡献在于：第一，发表了一个公开的文献引用数据集SSN，这个事情以后再说；第二，提出了一个结合引用与文本信息的文献摘要生成模型CGSum (citation graph-based summarization model)，本文仅简单介绍一下这个。
传统document summarization方法往往将任务构建为sequence-to-sequence problem，即通过文本生成摘要。
但实际上，文献之间的引用关系也对摘要生成任务有价值：文献的相关research community能帮助我们理解文献中的domain-specific terms。如下图举例，在原论文中只出现了专业术语，但在其引用的文献中出现了对术语的解释和类似语句的不同表示方式：
在这里插入图片描述
这个research community可以通过抽样出一个有source paper的subgraph得到。
模型将source paper的内容和subgraph的information分别encode，通过decoder得到abstract。神经网络模型使用的是BiLSTM和GNN。
评估指标用的是ROUGE credit method。

在本文中分别试验了transductive和inductive两种实验模式：
在这里插入图片描述
注意实验是将引用关系视为无向图进行的，但是抽取子图的时候是有边方向的（见模型介绍部分）。

2. Notation与模型介绍

2.1 Notation

略，待补。

2.2 CGSum

在理论上讲，作者要写摘要的时候，他肯定只能参考他引用的文章而非引用他的文章，所以在生成摘要任务中，要使用文献引用关系，也只能使用其reference而非citation。
所以在首先我们通过抽取子图生成一篇文献的research community（citation graph）时，对于某一节点（文献），我们生成一个它引用文献、引用文献再引用文献的图出来（这个图我一开始以为是树，后来想了一下，每一篇文献可能不只被research community中的一篇文献引用，所以不一定是树，反正就是一张有向图）。
建立citation graph的算法：
在这里插入图片描述
对每一个节点，我们利用其body text和citation graph中文献（不包括它自己）的abstract生成节点的abstract。

模型示意图如下：
在这里插入图片描述
source paper的body text和reference paper的abstract传入document encoder（BiLSTM），通过池化隐藏层表示向量初始化节点特征，根据节点之间的salience score对邻居进行抽样

由于什么直接抽样会打断 $f$ 中参数的训练的原因（为啥？因为没梯度可算了吗？）所以参考 Knowledge Graph-Augmented Abstractive Summarization with Semantic-Driven Cloze Reward.，将 $s$ 视为information gate）：