如今科技日益发展、网络技术不断深入到大众生活中,贴吧、网站、电子邮件,用户评论等使得人们有更多的便捷方式在网络中发表自己的意见和看法。这些数量庞大的文本中的情感信息有着极大的研究价值和实用价值。而如何能够从众多文本信息和数据中准确而高效地分析出文本中所蕴含的情感,并判断情感极性,对情感做出分类,是目前自然语言处理中的一个热门研究课题。关于文本情感分析,在此之前国内外专家和学者们都已经做了大量的研究,其中运用深度学习来对文本进行情感分析是常用的文本情感分析方法。神经网络模型通过学习和训练后,能有效地模拟人脑的学习方式,对大量的输入文本信息进行高效的分析,并对文本中的情感进行判断,非常适合用于文本情感分析的研究中。
关键词:文本情感分析;深度学习;CNN;LSTM;
完整代码见GitHub(包含IMDB数据集):https://github.com/HqWei/Sentiment-Analysis (代码疑问可以在GitHub上留言)
情感分析对象:
IMDB(Internet Movie Database互联网电影数据库)数据集,我们在这个数据集上做的训练和测试。这个数据集包含 25000 条电影数据,其中 12500 条正向数据,12500 条负向数据。我们将25000个文本中的23000个文本评论作为训练集,将剩下的2000个文本评论作为测试集。
图x,负面评价文本示例
图x,正面评价文本示例
文本预处理