基于维基百科的图命名实体链接
1. 引言
在命名实体链接(NEL)和词义消歧(WSD)领域,已有许多研究利用了不同的方法。简单的基于提及上下文和文章文本余弦相似度的消歧器在NEL评估中取得了成功,但也有其他系统利用了维基百科丰富的结构。同时,NEL和WSD在图结构上存在相似性,这促使我们探索WSD领域中基于图的成功方法是否适用于NEL。
2. 评估数据和方法
- TAC数据集 :Text Analysis Conference Knowledge Base Population (TAC - KBP)共享任务建立了常见的数据集,强调模糊查询,并规范了不指向知识库(KB)节点的查询的NIL链接。TAC查询由实体提及字符串和包含它的源文档组成,黄金标准是指向TAC KB节点或NIL(如果KB中没有相应节点)。数据集的比较如下表所示:
| 数据集 | N | KB | NIL | PER | ORG | GPE | News | Web |
| — | — | — | — | — | — | — | — | — |
| TAC 2009 test | 3,904 | 1,675 (43%) | 2,229 (57%) | 627 (16%) | 2710 (69%) | 567 (15%) | 3904 (100%) | 0 (0%) |
| TAC 2010 train | 1,500 | 1,074 (72%) | 426 (28%) | 500 (33%) | 500 (33%) | 500 (33%) | 783 (52%) | 717 (48%) |
| TAC 2010 t
超级会员免费看
订阅专栏 解锁全文
516

被折叠的 条评论
为什么被折叠?



