利用人工智能预测和预报新冠病毒病例
1. 研究背景
新冠疫情席卷全球,给人类的生命健康和经济发展带来了巨大的冲击。目前,研究人员多使用机器学习模型分别对新冠死亡病例和存活/康复病例进行预测和预报,但缺乏对全球各国新冠医疗数据集的综合研究,未能同时利用先进的人工智能/机器学习工具对同一数据集进行四种不同病例(活跃病例、确诊病例、死亡病例和康复病例)的预测和预报,并直观呈现全球各国的感染程度。
为应对新冠疫情的蔓延,提出了一个全面的研究框架,旨在通过数据驱动的方法来调查全球各国的新冠医疗数据。然而,由于缺乏可靠的新冠医疗数据,以及数据隐私、医疗行业和人机交互等方面的限制,数据驱动方法的作用尚未充分发挥。大规模收集感染者及其接触者的诊断数据,将是基于人工智能的重要解决方案,有助于减少经济损失并挽救生命。
2. 研究方法
2.1 执行环境
- 硬件:使用一台配备16GB内存、1TB SSD 8代的HP Envy机器。
- 软件:安装了Python 3.8,并导入了八个重要的Python库用于实验,具体如下:
- Matplotlib:用于可视化,是由John Hunter设计的ECOG可视化工具,可解决术前软件单许可证问题,供多个研究人员使用。
- Pandas、Seaborn、Plotly等:用于模型构建、绘图、模型性能评估等实验目的。
2.2 数据收集
从可靠来源获取了2020年1月至5月期间全球各国的新冠医疗数据集,该数据集包含以下特征:省份/州、国家/地区、纬度、经度