基于谓词 - 论元结构的语义意见检索
1 引言
在信息检索领域,意见检索是一个重要的研究方向。为了更有效地检索出与查询主题相关的意见性文档,提出了一种基于谓词 - 论元结构和主观形容词的语义意见检索方法。该方法通过构建线性相关性模型,结合语义相似度和主观性分析,提高了意见检索的性能。
2 构建基于语义的意见检索模型
2.1 主观成分识别
在英语中,形容词在表达情感方面起着重要作用。使用一份包含 1336 个主观形容词的列表来识别每个句子谓词 - 论元结构中的主观性。句子的主观性得分计算公式如下:
[score_{subj}=(\arg s_{struct}\cap (a_{n}\in A_{l}), n\geq1\leq l)=0.5]
其中,(\arg s_{struct}) 是谓词 - 论元结构,(a) 是主观形容词列表 (A_{l}) 中的形容词元素,(n) 是 (\arg s_{struct}) 中形容词的数量,(l) 是 (\arg s_{struct}) 的长度,常数 0.5 可以根据经验进行调整,非主观结构赋值为 0。例如,如果一个句子的谓词 - 论元结构包含五个术语,那么这些术语中至少有一个或多个必须出现在主观形容词列表中。
2.2 结构间的语义相似度
在得到表示句子潜在含义的谓词 - 论元结构后,需要识别这些结构之间的语义相似度。给定文档 (d) 中的一组格式良好的句子 (D = {s_{1}, \ldots, s_{m}}),使用语义相似度函数 (sim_{s}) 来估计给定自然语言查询 (q) 与每个格式良好的句子 (s) 之间的相似度得分,即 (sim_{s}(q,
超级会员免费看
订阅专栏 解锁全文
10

被折叠的 条评论
为什么被折叠?



