利用机器学习进行数据可视化以有效追踪新冠疫情
1. 新冠疫情背景
自2019年12月出现首例病例,短短3个月内,新冠疫情确诊病例就超过了292万例,迅速演变成一场全球性大流行疾病。新冠病毒具有高传染性和致病性,它不仅严重威胁人类生命健康,也给全球社会经济带来巨大冲击。
在这场抗疫战斗中,医护人员和卫生工作者奋战在一线,而数据科学家和机器学习专家则致力于将海量复杂的数据转化为易于理解的形式,为疫情防控决策提供支持。
在过去二十年里,曾出现过多次病毒性疫情,如2002 - 2003年的SARS - CoV、2009年的H1N1流感和2013年的MERS - CoV等。2020年1月30日,世界卫生组织宣布新冠疫情为国际关注的突发公共卫生事件,并于3月11日将其认定为大流行疾病。
许多经济欠发达国家需要技术和资金支持来应对疫情,非洲、亚洲和拉丁美洲的一些国家正在加快检测试剂盒的研发。新冠病毒存在显著的毒株差异和序列结构变化,有证据表明序列信息与病毒的传播能力相关。在中国、印度、美国等多个国家,许多医护人员不幸被感染。
疫情传播主要通过密切且无防护的直接接触或在感染环境中的活动。各国通过病例发现和接触追踪来查找病毒传播链,并采用了许多基于机器学习的文本和数据挖掘技术。以下是一些用于预测病毒传播的统计估计模型:
- 对疾病及其源头的假设
- 感染到症状出现的天数估计
- 城市封锁时间
及时了解病毒的传播情况对于评估其对人类的影响至关重要,也有助于制定干预策略。探索性数据分析(EDA)是理解这些数据的重要第一步。
2. 数据预处理
在当今时代,信息被视为一种重
超级会员免费看
订阅专栏 解锁全文
279

被折叠的 条评论
为什么被折叠?



