实体消歧问题是当下比较热点的研究问题,国内外的大多熟研究从两个角度解决实体歧义造成的影响,分别是通过寻求更高质量的特征和引入外部资源辅助消解。
在特征选取方面,何正焱[2]利用DNN(深度神经网络)方法,提出了一种文档和实体的相似度为框架的消歧模型;姜丽丽[3]提出了一种基于带权图结构的框架来实现人物实体的消歧工作,并使用实体标签对每个人物实体进行标注;Bagga和Baldwin[4]将不同文档间上下文的相似度作为特征实现实体消歧的;R.Bekkerman和A.McCallum[5]则结合了社交网络的链接信息和聚类两种非监督的框架对社交网络中的人物实体进行消歧。
给定的文档集中所包含的被査询人的信息往往是非常有限的,因此网络公共资源经常被用来挖掘更多的信息以提高同名消歧质量。其中,中科院的韩先培[6]使用了在线知识库信息来辅助解决实体歧义的,