1简介
本文根据2020年《Joint Keyphrase Chunking and Salience Ranking with BERT》翻译总结。
本文描述了一个关键短语(keyphrase)提取的模型:BERT-JointKPE.
KeyPhrase Extraction (KPE)是从一个文档中提取重要的主题短语。有点像命名实体识别,但比命名实体范围更适用,因为提取的某些短语不是实体,但却是有意义的短语。
JointKPE 联合采用了两个子网络,一个是分块网络(chunking network)来识别高质量的短语,一个排名网络(ranking network)来学习短语的显著性。JointKPE尤其擅长预测长的keyphrase,并且擅长提取的这些keyphrase一部分不是实体,但却是有意义的短语。
2 方法



3 实验结果
可以看到JointKPE效果很好,超过以前模型。

从下图b可以看出来,JointKPE对于长的keyphrase效果更好。图a是说chunk方法倾向于预测短的keyphrase。

下面图c可以看出来JointKPE对非实体(Non-Entity)短语处理能力也很好,图b说明JointKPE对实体短语处理也很好。


本文介绍了BERT-JointKPE模型在关键短语提取任务上的应用,该模型结合了分块网络和排名网络,尤其擅长预测长的非实体关键短语。实验结果显示,JointKPE在提取长keyphrases和非实体短语方面表现出色,超越了以往的模型。
3261





