2018-3-7论文网络评论中非结构化信息的表示与研究--------实验分析

数据来源:

(1)电子商务网站提供的网路评论

(2)专门提供网络评论交流平台的网络

(3)文章中使用的数据为网上某商城关于“某品牌中的一种型号纸尿裤(价格75RMB)”的2526条评论


操作------网路评论预处理

使用的是中科院的ICTCLAS分词系统

来源:

ICTCLAS_百度百科
https://baike.baidu.com/item/ICTCLAS/8609504?fr=aladdin


选择十个平论进行词性标志:

名词:  评价的事物,可以统称为特征

形容词: 往往是表示观点的极性词语

副词:  修饰词,具有加强或减轻观点倾向的作用


网络评论中的特征词的提取--------------------通过相关性的数值来确定


在类别相关中,我们需要设置阈值,当每个数据都超过阈值的时候则进行保存-----------------保存之后的特征进行特征与特征之间的相关性计算

F-相关性计算


通过去除冗余的特征就完成了特征集合N的确定


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值