自然语言处理NLP——情感分析（Sentiment Analysis）简述

最新推荐文章于 2025-07-19 10:16:00 发布

高斯拟合的周萌萌

最新推荐文章于 2025-07-19 10:16:00 发布

阅读量2.2w

点赞数 5

CC 4.0 BY-SA版权

分类专栏： nlp 文章标签：情感分析 NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_35227692/article/details/79201448

本文介绍了情感分析的基本概念，包括如何识别主观句、Bing Liu的情感分析模型，以及两种主要的分析方法：gradable lexicon-based和corpus-based/supervised machine learning。gradable lexicon-based方法涉及多种规则，如否定、大写、强调词等，而corpus-based方法则使用朴素贝叶斯分类。尽管情感分析存在如指代解析等挑战，但其在文本理解中的应用依然广泛。

基于文本的情感分析，主要关注文章中的主观句，所以，subjective classifier即将主观句从文本中分离出来，就是整个情感分析的第一步。一般来说，这个方法是基于规则的分类方法——句子中包含n（一般为2）个表达情感的词语时就认为这个句子是主观句。

对于这个问题，Bing Liu 给出了一个情感分析的模型，对于非比较主观句而言，分为五个成分：

O 为实体对象

F 为实体特征

SO 为个人情感倾向

H 情感持有人

T 情感表达的时间

对于事物之间有比较关系的主观句，分为六个部分。（比上一个多了个实体O， SO也变为了PO，意为prefer object，更倾向于哪个）

分析的方式主要有两种：

1. gradable lexicon-based

即为给每个情感词语打分，最后将句子中的所有分数加起来，与一个阙值进行比较（一般就是0）。

在这个过程中，有几种常用的打分规则：

a，negative rule：

就是情感词前边有否定，则将这个情感词分数的绝对值减1 再符号取反

b， capitalization rule：

情感词如果被大写的话，其绝对值在原基础上加1，符号不变

c， intensifier rule：

前边有强调词（强调词也有各自的评分），正加负减

d， diminisher rule：

有表示略微意思的词，正减负加

e， exclamation rule：

用一些符号取强调情感，如！！！，正加负减

f， emotion rule：

符号表情（也有各自的评分）

这个方式的优点就是，词语库可扩展，并且不需要训练，运行效率很高

缺点就是，这个词语库是需要维护的，并且词语在出现过程中，很可能伴随着缩写和错别字等情况。

2. corpus-based/supervi

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。