Chinese Sentiment Orientation Analysis
中文情感倾向性分析(IEEE2010)
文章提出了一个新方法分析、划分商品评论的情感倾向性为3类:中立,积极和消极。目前的方法对于中立态度的句子不能得到好的划分结果。文章首先采用分治策略划分文本为2类:中立和极性文本,然后极性文本分为积极部分和消极部分(两层分类系统)。在第一步中,使用TSVM(直推式SVM)工具实现划分。
词典修订和规则集生成
多层情感词典:由于词典规模大,因此要修订词典,期望减少低置信度词的消极影响。首先,重新评估每个情感词的置信度,然后,高置信度的词添加到相对小的词典D1,剩下的词用来形成一个更大的词典D2:根据域关联训练语料和域独立训练语料重新计算情感值分别为v和v’,最终的情感值wor