印度新冠疫苗推广的情感分析
1. 情感分析方法
情感分类技术主要分为基于词法的方法和基于机器学习的方法,基于词法的方法又可进一步分为基于词典和基于语料库的方法。
- 基于词法的方法 :依赖情感词法,即已知且预编译的情感术语集合。
- 基于词典的方法 :使用在线词典对单词进行标注。
- 基于语料库的方法 :依靠文本语料中嵌入的共现统计或句法模式。最终会得到一个包含单词先验信息的语言资源。情感词法是一个包含正负词的词典,例如“joy”“great”为正词,“terrible”“cruel”为负词。通过统计文本中正负词的出现次数,利用统计或语义方法为文本分配正负得分以确定情感极性。这种方法相对基于机器学习的方法更容易实现,因为它不需要为训练数据进行标注。
- 基于机器学习的方法 :可以使用特定领域的数据来训练模型,以分析给定文本,从而提高情感分析的准确性和置信度。
2. 所使用的工具和方法
2.1 基于词典的情感分析工具
- TextBlob :是基于NLTK构建的Python库,用于处理文本数据。它提供了简单的API来执行常见的自然语言处理(NLP)任务,如词性标注、情感分析、名词短语提取、分类、翻译等。其情感函数返回极性和主观性。极性是[-1.0, 1.0]范围内的浮点值,-1.0表示负面陈述,1.0表示正面陈述;主观性也是[0.0, 1.0]范围内的浮点值,0.0表示非常客观,1.0表示非常主观。
超级会员免费看
订阅专栏 解锁全文
37

被折叠的 条评论
为什么被折叠?



