使用机器学习技术对新冠疫情推文进行情感分析
1. 引言
在疫情等危机情况下,公众的想法、情绪及其应对准备,通常可通过印刷媒体、电视、网络帖子、论坛、社交媒体等渠道提前预警。公众健康监测涵盖健康观察、追踪健康风险、季节性疫情爆发及各类危机,旨在降低公众健康风险。以往,常通过健康相关调查来了解人们在健康危机中的感受。
随着网络和社交媒体的发展,“信息流行病学”应运而生,它为公众提供了丰富的健康相关信息和治疗数据。Twitter作为一个微型博客网站,允许用户以推文的形式分享想法和感受,目前其活跃用户约3.3亿。庞大的用户群体使Twitter成为生成数据的重要来源,对其数据进行情感分析和挖掘具有重要价值。
传染病会在各国传播并影响大量人口,疾病监测和早期发现是电子健康数据的重要组成部分。包括Twitter在内的社交媒体能提供关键信息,通过公众对话和长期记录,可预测疫情爆发。社交媒体用户分享的健康记录和期望,可作为分离公众对疫情普遍情绪的工具。在疫情爆发时,Twitter上的推文是了解公众情绪的重要数据来源,它也是了解公众在疫情期间行为、评估疫情程度、监测疾病爆发问题和进行情感评估/挖掘的有效工具。
新冠病毒疾病(COVID - 19)是由新型冠状病毒引发的传染性疾病,通过飞沫污染、表面接触等迅速传播,在全球许多地区引发了恐慌和危机。本文采用基于框架阅读的方法,分析与COVID及其封锁影响相关的推文,对带有新冠病毒和封锁标签的推文进行标记(积极、消极或中立),并使用多种分类器研究其精度和性能,这些分类器包括决策树、回归、支持向量机和朴素贝叶斯模型。
此外,还有一些相关的研究成果。例如,有人提出了用于COVID - 19的儿科和老年免疫网络移动计算模型
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



