结合领域知识与深度学习进行情感分析
1. 引言
意见在个人和组织的决策中起着重要的参考作用。在互联网出现之前,人们主要通过朋友、家人或企业的消费者意见调查来获取意见。随着信息和通信技术的爆炸式发展,大量信息涌现,但其中一些信息虽“量大”却缺乏实用价值,这给个人和企业在咨询、搜索、综合信息以及评估和跟踪客户对产品和服务的评论方面带来了困难。因此,意见挖掘/情感分析应运而生,并迅速发展,受到研究界的广泛关注。
情感分析的研究在不同层面展开,包括术语层面、短语层面、句子层面和文档层面。相关的研究方法主要有以下两种:
- 词典方法 :在情感分析中大量使用情感术语,包括积极和消极术语,还有意见短语或习语,可归类为意见词典。胡和金提出的基于词典的方法展示了利用词典识别情感术语的策略。
- 基于语料库的方法 :该方法基于句法和模式分析,在大型数据集中寻找情感词汇。
近年来,随着树库(TreeBank)的引入,特别是斯坦福情感树库(Stanford Sentiment Treebank),使用深度学习进行情感分析成为该领域的新兴趋势。递归神经张量网络(RNTN)应用于树库并取得了高性能。此外,卷积方法不断发展用于句子的情感分析,循环神经网络系统如长短期记忆网络(LSTM)与卷积结合用于短文本的情感分析。最近,还提出了一种结合深度学习架构的情感分析方法。
然而,当深度学习应用于不同情感领域的真实数据集时,会出现一些问题:
- 每个领域都有不同的情感术语集,且每个术语具有不同的情感得分,但目前深度学习方法对此考虑不足。
- 深度学习使用损失函数评估学习过程的误差,但
超级会员免费看
订阅专栏 解锁全文
37万+

被折叠的 条评论
为什么被折叠?



