本文主要对网上能搜索到的、现有的基于文本的情感分析方法进行总结和归纳。文本会比较零碎。在下一篇文章中,将对零散知识进行整理。最终应包含4个内容:
- 什么是基于文本的情感分析
- 常用词典和数据库
- 自然语言处理流程
- 深度学习情感分析工具
以下开始正文。
什么是情感分析:对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。利用机器提取人们对某人或事物的态度,从而发现潜在的问题用于改进或预测。这里我们所说的情感分析主要针对态度(attitude)。
注:Scherer 情感状态类型主要可以分为:
情绪(emotion):有一定原因引发的同步反应。例如悲伤(sadness),快乐(joy)
心情(mood):没有明显原因引发的长期低强度的主观感受变化。例如忧郁(gloomy),倦怠(listless)
人际立场(interpersonal stance):对他人的特定反应。例如疏远(distant),冷漠(cold)
态度(attitude):对特定人或事物的带有主观色彩的偏好或倾向。喜欢(like),讨厌(hate)
个性特质(personal traits):相对稳定的个性倾向和行为趋势。例如焦虑(nervous),渴望(anxious)
什么是opinion:
一条评论可以分为四个部分(g,s,h,t)。g(target)为对象,s(sentiment)为情感,h(holder)为评论者,t(time)为评论时间
在更深层次分析时,实体(对象)在组成或属性上又可分为不同部分。可以使用简明化得树型图表示,根节点为实体,叶子节点为实体的不同方面。
这样评论又进一步分为五个部分(e,a,s,h,t)e(entity)为实体,a(aspect)为方面
主要过程:
- 确定一个词是积极消极、主观客观、情感强度。英文词典SentiWordNet。
- 确定一个句子是积极消极、主观客观、情感分值。
这里有个问题:同一个词在不同语