自然语言处理NLP——情感分析(Sentiment Analysis)简述

本文介绍了情感分析的基本概念,包括如何识别主观句、Bing Liu的情感分析模型,以及两种主要的分析方法:gradable lexicon-based和corpus-based/supervised machine learning。gradable lexicon-based方法涉及多种规则,如否定、大写、强调词等,而corpus-based方法则使用朴素贝叶斯分类。尽管情感分析存在如指代解析等挑战,但其在文本理解中的应用依然广泛。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

基于文本的情感分析,主要关注文章中的主观句,所以,subjective classifier即将主观句从文本中分离出来,就是整个情感分析的第一步。一般来说,这个方法是基于规则的分类方法——句子中包含n(一般为2)个表达情感的词语时就认为这个句子是主观句。

对于这个问题,Bing Liu 给出了一个情感分析的模型,对于非比较主观句而言,分为五个成分:

O 为实体对象

F 为实体特征

SO 为个人情感倾向

H 情感持有人

T 情感表达的时间

对于事物之间有比较关系的主观句,分为六个部分。(比上一个多了个实体O, SO也变为了PO,意为prefer object,更倾向于哪个)


分析的方式主要有两种:

1. gradable lexicon-based

即为给每个情感词语打分,最后将句子中的所有分数加起来,与一个阙值进行比较(一般就是0)。

在这个过程中,有几种常用的打分规则:

a,negative rule:

就是情感词前边有否定,则将这个情感词分数的绝对值减1 再符号取反

b, capitalization rule:

情感词如果被大写的话,其绝对值在原基础上加1,符号不变

c, intensifier rule:

前边有强调词(强调词也有各自的评分),正加负减

d, diminisher rule:

有表示略微意思的词,正减负加

e, exclamation rule:

用一些符号取强调情感,如!!!,正加负减

f, emotion rule:

符号表情(也有各自的评分)


这个方式的优点就是,词语库可扩展,并且不需要训练,运行效率很高

缺点就是,这个词语库是需要维护的,并且词语在出现过程中,很可能伴随着缩写和错别字等情况。


2. corpus-based/supervi

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值