18、基于本体的网络用户情绪挖掘模型解析

基于本体的网络用户情绪挖掘模型解析

1. 特征选择与预处理

在进行网络用户情绪挖掘时,特征选择与预处理是关键的第一步。为了对特征序列进行有效处理,我们采用了特定的归一化方法。具体操作是,首先从每个特征序列中减去其最小值,然后将得到的差值除以该属性的取值范围,最后再乘以 10。

接下来,使用 F - score 这一特征选择过滤方法来衡量不同类别的区分度。对于特征向量 $x_k$($k = 1, 2, \cdots, m$),若高 valence 和低 valence 的数量分别为 $n_{highvalence}$ 和 $n_{lowvalence}$($n_{highvalence} + n_{lowvalence} = m$),则第 $i$ 个特征在 valence 维度上的 F - score 定义如下:
[
F(i) \equiv \frac{(x_{(highvalence)i} - x_i)^2 + (x_{(lowvalence)i} - x_i)^2}{\frac{1}{n_{highvalence}-1}\sum_{k = 1}^{n_{highvalence}}(x_{(highvalence)k,i} - x_{highvalence}i)^2 + \frac{1}{n_{lowvalence}-1}\sum_{k = 1}^{n_{lowvalence}}(x_{(lowvalence)k,i} - x_{(lowvalence)i})^2}
]
其中,$x_i$ 是第 $i$ 个特征序列的平均值,$x_{(highvalence)i}$ 是被归类为高 valence 的第 $i$ 个特征序列的平均值,$x_{(lowvalence)i

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值