数据来源:
(1)电子商务网站提供的网路评论
(2)专门提供网络评论交流平台的网络
(3)文章中使用的数据为网上某商城关于“某品牌中的一种型号纸尿裤(价格75RMB)”的2526条评论
操作------网路评论预处理
使用的是中科院的ICTCLAS分词系统
来源:
ICTCLAS_百度百科
https://baike.baidu.com/item/ICTCLAS/8609504?fr=aladdin
选择十个平论进行词性标志:
名词: 评价的事物,可以统称为特征
形容词: 往往是表示观点的极性词语
副词: 修饰词,具有加强或减轻观点倾向的作用
网络评论中的特征词的提取--------------------通过相关性的数值来确定
在类别相关中,我们需要设置阈值,当每个数据都超过阈值的时候则进行保存-----------------保存之后的特征进行特征与特征之间的相关性计算
F-相关性计算
通过去除冗余的特征就完成了特征集合N的确定
本文介绍了一种基于网络评论的情感分析方法,数据来源于电子商务网站及专业评论平台。通过对2526条关于某品牌纸尿裤的评论进行ICTCLAS分词预处理,并选取了10条评论进行了词性标注,包括名词、形容词和副词等。接着介绍了特征词的提取过程,通过设置阈值保留关键特征,最终完成特征集合的确立。
1914

被折叠的 条评论
为什么被折叠?



