基于循环神经网络 (LSTM) 的情感评论文本分类
一、简介
众所周知,区分用户发帖或者评论文本的情感分类问题,对商家来说是很重要的,不仅可以及时了解到用户的情绪,而且可以帮助商家进行产品迭代。例如,“汽车之家” 网站上的用户评论,进过情感词分类后,可以得到很多有用的信息,如 “发动机有问题”,“总是烧机油” 等,故下面,我们就来尝试解决。
首先,对于情感分类问题,一般有两种解决方案,一是,基于情感词典的规则的解决方法,二是,基于机器学习以及深度学习的方法。这里我们采用后者方法。这里我们只是将情感倾向分为 支持,反对,以及中立。读者当然可以根据自己的需求,分的更加详细。一般基于词典的规则方法,优点是非常稳定,缺陷是对于不在词典中的词就效果很差,而深度学习的方法,需要人工标注语料作为训练集,提取出文本的特征,用特征构建一个分类器,在做情感分类。它因为具有一部分语境,而避免了部分情感词典的缺点。但是它由于特征抽取方法不同,而导致有噪音,通用性不好。必须针对特定语义环境特定训练模型才行。
为了,克服这两种方法的缺点&#