社交媒体文本情感分析与神经机器翻译研究
在当今社会全球化的背景下,数字技术广泛应用,世界的联系愈发紧密,翻译在信息交流中扮演着至关重要的角色。无论是消费者获取外语信息,还是研究人员进行多语言研究并发表成果,都离不开翻译。机器翻译作为自动化的翻译方式,不仅帮助普通用户进行日常翻译,还能辅助专业译者快速完成工作。同时,在社交媒体如 Twitter 上,对文本进行情感分析以提取主观信息,为决策系统提供结构化和可操作的知识,也成为企业和政府机构日益关注的任务。
社交媒体文本情感分析
在情感分析方面,研究人员使用了多种机器学习模型,对不同的数据集进行评估,以找出最适合情感识别的方法。
评估指标数据
以下是不同模型在不同数据集下的评估指标:
| 模型 | 基线 | 短停用词 | 长停用词 |
| — | — | — | — |
| KNN | 0.400 | 0.398 | 0.491 |
| SVM | 0.570 | 0.517 | 0.496 |
| 随机森林 | 0.758 | 0.780 | 0.762 |
| 朴素贝叶斯 | 0.686 | 0.689 | 0.685 |
| 逻辑回归 | 0.756 | 0.739 | 0.721 |
这是训练和测试集占比为 10% 时的评估指标数据库。
模型 | 基线 | 短停用词 | 长停用词 |
---|---|---|---|