一种新颖的事件网络匹配算法
一、引言
在自然语言处理领域,文本表示是一个重要问题,广泛应用于信息检索、文本分类等场景。近年来,人们倾向于使用比关键词和概念更丰富的文本表示方式。在此背景下,研究适用于不同文本表示的文本比较方法十分必要。本文采用事件网络来表示文本,并提出了一种新的事件网络匹配方法。
事件网络是一种新的文本表示模型,可看作图,但具有许多额外特征。图匹配理论对事件网络匹配有一定帮助,常见的图匹配方法来自图论和信息检索,主要分为最大公共子结构和距离变换两类。在信息检索中,概念图的比较研究和应用广泛,如 Jonathan Poole 定义了概念图匹配的三种相似性(表面、结构和主题相似性),H.P.Zhu 在此基础上定义了概念图语义相似性的概念相似度、关系相似度和图相似度。然而,事件网络与图和概念图在结构和意义上有显著差异,现有匹配方法不能直接用于事件网络匹配,因此需要研究新的匹配方法。
二、前期工作
2.1 事件与事件相似度
事件是人类认知的基本单位,源于认知科学,常见于哲学、认知科学、语言学和人工智能等领域的文本中。不同应用对事件的定义不同,但大多强调两类事件属性:动作(动词或动作名词)和动作特征(参与者、地点、时间等),这些属性被称为事件元素。
事件识别和事件聚类对基于事件的信息查询、自动问答和自动摘要等至关重要,这些都与事件相似度直接相关。计算两个事件相似度的方法是:先计算对应事件元素的相似度,再通过元素相似度的加权求和计算两个事件的相似度。给定两个事件 (e_1) 和 (e_2),表示为 (e_1=(H_{11},H_{12},\cdots,H_{1n})),(e_2=(H_{21},H_{22},
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



