2018-3-6论文-网络评论中非结构化信息的应用于研究------(语义矩离)

本文介绍了语义距离的概念及其计算方法,重点讨论了利用同义词词典进行语义相似度评估的技术。通过《同义词词林》扩展版中的编码来衡量词汇间的语义相近程度,包括编码层次及权重分配等内容。

语义矩离

用来描述特征词之间的语义相似度。

常用的计算方法主要有:                根据同义词词典求2个词语编码的矩离

在文章中使用了哈工大的《同义词词林》扩展版


(1)每个词有若干个编码,每个编码有5层代码和1位标志位描述      比如:

(2)含义:  5层代码分别描述大类,中类、小类、词群和原子词群

                       标志位为“=”表示同义,“#”表示同类,属于相关词、“@”表示词语自我封闭,独立,在词典中没有同义词,也没有相关词

问题一:为什么每个词有若各个编码?

我:每个词在不同的语境中有不同的意思

先相关的定义

3-5: 定义语义矩离,根据层数的高低为其赋权重(谁的影响大,谁的话语权就大)


3-6编码之间的矩离

类似于特征之间的矩离,编码与编码支之间也遵循,层次的高低


3-7.特征之间的相似的。


问题:阿尔法是的意义,没有明白




评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值