paper 记录

本文探讨了自然语言处理在文本摘要中的应用,如对比候选生成和选择来提高摘要的忠实性,以及使用指针生成网络进行摘要。此外,还介绍了无监督数据增强在一致性训练中的作用,以及GRU在网络中的应用和池化、注意力机制、特征丰富输入和复制机制在神经问句生成中的实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Improving Faithfulness in Abstractive Summarization with Contrast Candidate Generation and Selection

摘要中所有实体在source中出现,作为positive sample

we sample examples from the XSum training set where all entities in the ground truth summary appear in the source document.

用相同语义类型,但是不同实体的进行替换,产生不忠实的变体,作为负样本

produce unfaithful variants from the ground truth summary by replacing entities with others that have the same semantic type but different surface form in the source text

pair(pos,neg)进行正负样本的计算

L=L_{XE}(y_{+}^{hat},1)+L_{XE}(y_{-}^{hat},0)+L_{RANK}(y_{+},y_{-})

L_{RANK}=max(0,y_{-}^{hat}-y_{+}^{hat}+\gamma )

Encode, Tag, Realize: High-Precision Text Editing

1.给出一种新型生成思路,应用任务包括:sentence-fusion,sentence-spliting,abstract-summary

   通过标签的delete/keep/P/swap/prounoun等标记后续对token的处理方式

2.tag输出包括 ffd方式和ar两种方式;

3.优势:target set少,依赖于更少的语料,

4.训练数据准备,通过生成前和生成后,能够映射的即为tag-keep,在P集合内的即为keep,其余的记为delete;   

    P集合准备,通过训练数据准备样式,进行预挖掘准备

5.应用:预处理模块由规则升级为模型



<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值