Comments-Attached Chinese Microblog Sentiment Classification Based on Machine Learning Technology
Bo Yan, Bin Zhang, Hongyi Su, and Hong Zheng Key Lab of Intelligent Information Technology, Beijing Institute of Technology, Beijing, CN {yanbo,binz,henrysu,hongzheng}@bit.edu.cn
摘要:当今,随着社交网络的迅速发展,以社群为导向的网络情感分析技术在数据挖掘领域成为热门话题。由于其简洁和灵活的特点,微博对情感分析提出了新的挑战。本文根据朴素贝叶斯(NB)和支持向量机(SVM)提出了一个方法,将微博情感分为积极的和消极的。基于数据处理、情感词典构建,结合用户评论的要素,假定附带评论的微博情感分类有助于提高分类的准确性。本实验证明了该方法的有效性和语言表达方式对消极行为的促进作用。
算法
输入:当前批次下带标签的训练集Tn;当前批次下无标签的测试集Un;当前批次下目标微博微博的评论集Cn;
输出:语义指向,O (Un);
要求:分类所用的分类器,Mnb or Msvm;
1.依据选择方法的帮助,从Cn中提取可靠的消极或积极的评论集Vn;
2. Vn = VTn cup VUn,对目标微博样本;
3.借助分级器在Tn ∪VTn上训练模型;
4.在Un ∪VUn中对测试样本进行分级;