Named Entity Recognition for Entity Linking: What Works and What’s Next [pdf]
- 论文状态:被EMNLP21-findings接收
- 作者:Simone Tedeschi, Simone Conia, Francesco Cecconi and Roberto Navigli
- TL;DR: 本文尝试了各种利用命名实体类别信息辅助实体链接的方法,发现NER能够很好的在少样本训练的情况下辅助实体链接模型.
1. Motivation
作者想缩减采用大规模和有限规模数据训练出来的NL模型的表现差距,于是便采用了NER做辅助信息.
2. Contribution
- 引入了新的细粒度NER分类,可以用他们来自动地给维基百科实体标注.
- 提出了4种引入NER信息的方法:i) NER-enriched entity representations, ii) NER-enhanced candidate selection, iii) NER-based negative sampling, and iv) NER-constrained decoding.
3. Model
有4种引入NER信息的方法.
比如,其中NER辅助的候选实体生成模块会采用NER信息过滤:

4. Experiments
在只用18k数据训练的情况下,NER能提升EL baseline 到接近GENRE 的9000k的效果:

5. Key takeaways
- 在少样本训练的时候,NER信息可以辅助EL系统
该论文探讨了如何利用命名实体识别(NER)来增强实体链接(EL)系统,特别是在少量样本训练的情况下。作者提出四种方法:增强的实体表示、改进的候选选择、基于NER的负采样和NER约束解码。实验表明,在仅使用18k数据训练时,NER能够提升EL基线性能,接近使用大量数据训练的GENRE模型的效果。因此,NER信息在资源有限的环境下对于EL任务具有显著帮助。
1万+

被折叠的 条评论
为什么被折叠?



