《中国人工智能学会通讯》——11.47 领域文本中的实体链接技术

提出一种新的概率模型SHINE,用于将领域文本中的命名实体链接到特定领域知识库中,如DBLP文献网络。该模型包括实体流行度模型和实体对象模型两部分,实验证明其在DBLP文献异构网络上的效果显著优于基准方法。

11.47 领域文本中的实体链接技术

除了通用知识库,我们还拥有很多领域知识库(如 DBLP 文献网络 、IMDb 电影网络)。将领域文本中的命名实体链接到相应领域知识库,对领域文本的分析和领域知识库的扩充非常有帮助。目前主流的实体链接算法都是针对通用的维基百科或者由维基百科生成的知识库(如 YAGO),这些算法都依赖于与维基百科相关的特征,例如维基百科文章中的上下文文本信息、基于维基百科的相关度度量,以及维基百科的一些特殊结构(如排歧页面、跳转页面等)。由于领域知识库并不具备这些特征,所以之前的实体链接算法都不能应用于领域文本中的实体链接任务。我们提出一个概率模型 SHINE [48]来解决这个问题,它主要由两个子模型构成,分别是实体流行度模型和实体对象模型。实体流行度模型表明实体的流行程度,即在不知道上下文的情况下观察到某个实体的可能性。实体对象模型表明观察到领域知识库中的对象出现在某个实体周围文本的可能性。实验针对 DBLP 文献异构网络进行测试,结果表明,我们提出的概率模型算法远远优于基准方法且具有很好的扩展性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值