自动词网扩展评估方法与词义消歧关联规则挖掘
自动词网扩展评估方法
在自动词网扩展领域,有一种新的评估方法,可应用于一类自动扩展词网的算法。该方法基于多年来由词典编纂团队在 WordnetWeaver 半自动化词网扩展系统支持下进行 plWordNet 扩展所积累的经验。
词网扩展的基础计算
在进行词网扩展时,需要计算给定词条与同义词集合中所有词条之间的词条 - 词条匹配度,以及邻域同义词集的匹配度。这里的邻域是指距离不超过最大距离的同义词集,距离通过关系链接路径的长度来计算。在实验中考虑的关系包括上位关系、下位关系、部分关系、份额关系、地点关系等多种。
词条 - 同义词集匹配值会根据加权投票方案转换为强匹配(对于较大的同义词集,需要更高的累积“票数”总和;对于较小的同义词集,要求较低),并通过实验设置参数的非线性过滤转换为弱匹配。之后,将与输入词条匹配的同义词集分组到描述输入词条含义的激活区域中。
在第二阶段,根据词条与同义词集之间的强匹配和弱匹配,识别上位词词网结构的连通子图,即激活区域。每个激活区域仅包含与词条的语义匹配度高于某个阈值的同义词集,并为其分配与词条的语义匹配值,该值定义为词条与该区域同义词集之间语义匹配值的最大值。弱匹配有助于避免激活区域过于碎片化和过小,但这依赖于预定义的阈值。
评估方法应用
该评估方法用于比较两种最先进的词网扩展算法:算法的激活区域附着(AAA)和概率词网扩展(PWE)。
-
输入数据
- 评估框架输入数据
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



