情感词生成 [opinion mining]

最新推荐文章于 2024-01-06 00:41:55 发布

原创

最新推荐文章于 2024-01-06 00:41:55 发布 · 2.7k 阅读

2 ·

CC 4.0 BY-SA版权

本文探讨了情感挖掘中的情感词生成，包括情感分类和情感抽取。通过词典和语料库方法判断词的情感极性，如极词性扩展、情感词典以及基于语料的共现模式。情感词对于理解句子情感至关重要，尤其在面对同一词在不同语境和领域中情感极性变化的情况。

我们知道，在情感挖掘中，主要有情感分类(Sentiment Classification)和情感抽取(Opinion Extraction)。对于文档情感分类，一般是构造特征向量来进行分类或是聚类。也有通过计算文档中词的情感分数来获取文档的情感极性，然而这种方法用的不多，效果也不佳。但是对于句子级别的情感挖掘，由于特征少，情感分类效果没有那么理想，而句子的情感往往是由句子中的几个情感词决定。因而获取情感词在情感挖掘中很有用。而构造情感词典(sentiment lexicon)往往也是许多无监督学习方法中的首要一步。

通常从情感角度来说，一个词可以分为三类：褒义词、中性词、贬义词。然而，由于语境的不同，领域的不同，同样一个词，其情感极性可能就不同。例如：（http://zhidao.baidu.com/question/159946153）

“灯红酒绿”有两个意思，它既可形容寻欢作乐的腐化生活，是贬义词；也可形容都市或娱乐场所的繁华景象，是褒义词

有时甚至在同一领域由于语境同一词的情感极性也不同。例如照相机的评论：

电池寿命很长。（正）

需要很长时间聚焦。（负）

以下介绍几种判断词情感的早期的比较经典的方法，主要有基于词典的方法和基于语料的方法。后发现刘兵编的《web数据挖掘》中文版320页的倒数第二段有总结的更典型的参考文献。

利用词典：

1.极词性扩展（近义词、反义词）

(Hu & Liu, 2004)形容词：对评论进行POS标记，利用关联挖掘获取频繁产品特征(如颜色、质量等)，在含有特征的句子中抽取形容词作为情感词。根据同义词情感极性相同，反义词情感极性相反，给定几个有极性的种子形容词如美丽等，利用wordnet不断查找它们的同义词和反义词以扩大情感词词典直到其数量不

最低0.47元/天解锁文章