第五章 实体消歧 阅读笔记
5.1 任务概述
在实体识别的结果中,一方面,同一实体在文本中会有不同的指称(指称的多样性);另一方面,相同的实体指称在不同的上下文中可以指不同的实体(指称的歧义性)。因此必须对实体识别的结果进行消歧才可以得到准确、无歧义的实体信息。实体消歧的目的是解决文本信息中广泛存在的名字歧异问题。
5.1.1 任务定义
实体消歧可以通过以下六元组进行定义:
M = N . E , D , O , K , δ . M = N.E,D,O,K,\delta. M=N.E,D,O,K,δ. N = n 1 , n 2 , ⋅ ⋅ ⋅ , n l , N=n_1,n_2, \cdot\cdot\cdot,n_l, N=n1,n2,⋅⋅⋅,nl,是待消歧的实体名集合。
E = e 1 , e 2 , ⋅ ⋅ ⋅ , e k , E=e_1,e_2, \cdot\cdot\cdot,e_k, E=e1,e2,⋅⋅⋅,e

本文详细介绍了实体消歧的任务定义、分类及评测标准,重点探讨了基于聚类和实体链接的两种方法。在聚类方法中,通过表层特征、扩展特征和社会化网络来计算相似度。实体链接则涉及候选过滤和链接方法,包括向量空间模型、主题一致性模型等。此外,协同实体链接和神经网络方法也在实体消歧中发挥重要作用。
最低0.47元/天 解锁文章
393

被折叠的 条评论
为什么被折叠?



