日常笔记summarized here。
《Thumbs up?Sentiment Classification using Machine Learning Techniques》2002年
这篇文章只是简单的把一篇文档里的词的数量组成一个特征向量来表示该文档。
情感分类的特征选取对分类正确率的影响:
- unigrams比bigrams的效果好
- “特征是否出现”比“特征频率”的效果好
- 词性对效果的影响并不大
- 词的位置对效果的影响并不大
本文探讨了2002年的研究《Thumbsup?SentimentClassificationusingMachineLearningTechniques》,介绍了如何利用简单的文档词频特征进行情感分类。文章指出unigrams相较于bigrams更有效,“特征是否出现”比“特征频率”更为重要。
日常笔记summarized here。
《Thumbs up?Sentiment Classification using Machine Learning Techniques》2002年
这篇文章只是简单的把一篇文档里的词的数量组成一个特征向量来表示该文档。
情感分类的特征选取对分类正确率的影响:

被折叠的 条评论
为什么被折叠?