阿拉伯语在线情感分析工具评估研究
1. 引言
社交媒体在当今世界占据着重要地位,每天都会产生大量的社交网络帖子。社交网络研究成为热门领域,其中情感分析(SA)和意图检测是重要的子问题。社交网络允许用户分享文件、照片、视频,发布帖子、发送消息等。近年来,社交网络用户数量的增加导致决策因素动态变化,不同的社交平台如Snapchat、Instagram、Twitter和Facebook吸引了大量互联网用户。
约90%的阿拉伯青年使用社交网络,且在COVID - 19大流行期间,阿拉伯世界社交网络用户在Facebook、Instagram、Twitter和TikTok上的消费增加了75%。许多组织关注收集和提取用户意见,用于市场营销和广告等领域。情感分析属于数据挖掘领域,旨在从用户的社交评论或标签中理解、分析和提取需求,如今已成为获取准确信息的主要来源。
虽然有许多情感分析模型和工具被开发出来,但大多数不可公开使用,且针对阿拉伯语在线情感分析工具的研究较少。本文通过实验评估了两个纯阿拉伯语在线情感分析工具。
2. 研究方法
本文的主要目的是在多个数据集上评估两个纯阿拉伯语情感分析在线工具,具体步骤如下:
1. 收集阿拉伯社交网络(如Facebook和Twitter)的文本内容数据集,该数据集使用现代标准阿拉伯语(MSA)和阿拉伯语俚语。
2. 执行预处理步骤,构建阿拉伯语极性(正、负和中性)词典,并使用它们自动对收集的数据集进行类别标记。
3. 进行实验,测试两个SA工具:Sentest和Mazajak。
4. 使用预测质量测量方法评估和比较Sentest和Mazajak的结果。
5. 讨论实验
超级会员免费看
订阅专栏 解锁全文
29

被折叠的 条评论
为什么被折叠?



