论文阅读:Keyphrase Extraction for N-best Reranking in Multi-Sentence Compression

本文扩展了Filippova的基于词图的多句压缩方法,通过添加关键词提取的重排名步骤,选择包含最多相关关键词的压缩结果。文章介绍了TextRank计算节点显著性,生成并评估关键词候选,以及在多条路径上进行重排序的策略,以提升压缩信息的丰富性。同时,使用ROUGE评估时进行了停用词移除和词干化处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作者: Florian Boudin and Emmanuel Morin
来源: 2013 NAACL-HLT
概述:
这篇文章扩展了Filippova (2010)’s word graph-based MSC方法,添加了一个re-reranking步骤,使得包含最多相关关键词的compression被选择出来。
资源:
1. 代码:https://github.com/boudinfl/takahe
2. 数据集:https://github.com/boudinfl/lina-msc
相关工作:
1. Multi-sentence compression
a) Use a syntactic parser (control the grammaticality of the output)
b) Word graph-based approaches that only require a POS tagger (The key assumption is that the redundancy provides a reliable way of generating grammatical sentences. )
2. Keyphrase extraction
Supervised: 将其视为一个二分类问题,缺点:the need for training data; the bias towards the domain
Unsupervised: a) langu

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值