基于Word2Vec的电影评论情感分析机器学习方法
1. 引言
互联网的广泛使用使得大量数据可被获取,众多免费平台供用户分享观点。每天都有大量用户在虚拟平台上带着情感态度分享看法,手动处理如此大量的数据以提取情感几乎是不可能的,因此自动情感分析应运而生。
情感分析技术能够处理从各种社交网络平台收集的大量数据,并提取用户对特定产品或服务的态度。如今,大多数商业智能应用在很大程度上依赖于情感分析,因为商业分析师可以利用它来分析终端用户对不同产品、政策和服务的情感。情感分析是一种检查文本评论中隐藏观点并将其分类为不同情感类别的方法,主要分为积极、中性或消极。
目前主要有两种情感分析技术:词典方法和机器学习方法。词典方法中,基于意见倾向元素的相互内容计算单词的极性得分来确定文本内容的意见趋势,该方法高度依赖预定义词典来计算情感得分,其性能很大程度上取决于词典的质量。而机器学习方法则从标记数据集中提取特征,使用这些特征训练分类器以创建能够从一些未知数据中预测情感的分类模型。由于基于词典的方法准确性较差,研究人员将注意力转向了基于机器学习的方法。
2. 相关工作
许多研究人员在情感分析方面做出了贡献,主要分为基于词典和基于机器学习两类。例如,Pang和Lee成功应用支持向量机(SVM)、最大熵等分类方法对电影评论进行分类并取得了令人满意的结果;Ye等人使用监督情感分类技术分析在线旅游笔记,提高了搜索引擎返回旅游笔记的准确性和召回率;Raja等人使用基于模式的机器学习方法分析Twitter数据以观察人们的情感。
3. 提出的方法
本方法从数据收集到获得理想输出的详细流程如下:
超级会员免费看
订阅专栏 解锁全文
928

被折叠的 条评论
为什么被折叠?



