越南语客户评论多分类情感分析
1. 引言
在自然语言处理(NLP)领域,情感分析是备受关注的任务。在全球新冠疫情复杂的背景下,情感分析在社交媒体、电子商务、客户服务和市场研究等方面的应用愈发重要。众多大公司持续收集用户对产品的反馈和建议,并组建客户支持团队。这为企业了解客户心理、做出更准确决策提供了契机,同时还能从用户评论中提取有价值的信息。
本文聚焦于对越南大型电子商务平台上的评论数据进行情感分析,数据集包含 480,702 条客户评论,分为积极、消极和中立三类情感。我们先研究了基于深度学习的五种模型,即 TextCNN、LSTM、GRU、LSTM + CNN 和 GRU + CNN,然后深入探讨了基于这些训练模型的不同集成方案,如门控网络、挤压 - 激励网络、注意力网络、均匀加权和线性集成。实验结果表明,注意力网络技术在 F1 分数上达到 73.64%,表现优于其他方法。
2. 相关工作
在情感分析领域,张等人运用深度学习在英语和中文等流行语言上取得了显著成果。常见的方法是使用如 GloVe 或 Word2Vec 等词嵌入模型来表示单词,将其输入到带有 Softmax 函数的深度学习架构中以预测类别概率,主要使用的架构有卷积神经网络(CNN)和循环神经网络(RNN)。另一种方法是应用迁移学习,使用最先进的预训练模型并针对主要问题进行微调,如 BERT。
然而,大多数研究集中在英语上。对于越南语,多数电子商务数据的研究主要基于二元分类(消极或积极)。例如,Hung 等人使用结构袋技术和传统机器学习方法对越南教育调查系统进行主题分类和情感分析;Cuong 等人使用深度学习方法研究越南语评论的情感分析。但并非所有句子都有明确的情感极性,不
超级会员免费看
订阅专栏 解锁全文
585

被折叠的 条评论
为什么被折叠?



