文本情感分析与深度学习嵌入技术探索
1. 情感分析模型解读
在情感分析中,模型解读能够准确识别评论中导致负面情绪的方面。例如,“But it’s really the script that has over time started to bother me more and more.” 这样的表述就体现了负面情绪。有些评论同时包含积极和消极情绪,这使得它们成为较为复杂的分析对象,最终的解读权掌握在读者手中。我们可以利用相同的框架来解读自己的分类模型,了解模型在哪些方面表现良好,哪些方面需要改进。
2. 主题模型分析
2.1 主题模型概述
分析情感背后的关键术语、概念或主题的另一种方法是使用主题建模。主题模型的主要目的是提取和描绘大型文本语料库中潜在且不显著的关键主题或概念。这里我们使用非负矩阵分解(Non - Negative Matrix Factorization,NMF)进行主题建模。
2.2 数据预处理与特征提取
具体操作步骤如下:
1. 合并所有归一化的训练和测试评论,并将这些评论分为积极和消极情感评论。
2. 使用TF - IDF特征向量器从这两个数据集中提取特征。
以下是实现该步骤的代码:
from sklearn.feature_extraction.text import TfidfVectorizer
# 合并所有归一化评论
norm_reviews = norm_train_reviews+norm_test_reviews
# 获取仅包含积极评论的tf-i
超级会员免费看
订阅专栏 解锁全文
1003

被折叠的 条评论
为什么被折叠?



