卢旺达疟疾爆发预测研究
1. 研究背景与方法概述
物联网允许嵌入传感器的物理对象通过现有网络连接在任何时间、任何地点进行远程监控和控制。在卢旺达疟疾爆发预测的研究中,采用了多种方法,包括数据收集、数据可视化、数据准备与整理、机器学习模型训练与评估、基于实时物联网的数据收集系统设计与实现,以及将物联网系统与机器学习预测模型集成以对现场传感器的实时数据进行预测。
2. 数据准备与整理
2.1 数据收集与处理
- 疟疾数据:由 MINISANTE 记录,涵盖 2012 - 2019 年共 96 个月,按月汇总,包含 96 个样本。
- 温度、湿度和降雨量数据:由 METEO Rwanda 按日记录,同样来自 2012 - 2019 年。通过数据科学技术,将温度和湿度样本按月平均,降雨量样本按月求和,最终得到 2012 - 2019 年的 96 个温度、湿度和降雨量样本。
- 数据合并:将上述单独的数据集合并为一个包含特征和目标变量的单一数据集。为获得疟疾传播比率,将每个地区的疟疾病例数除以相应地区的人口数。
- 缺失值处理:温度数据中有 6 个缺失样本,用特定月份的平均温度值替换;湿度数据中有 30 个缺失样本,为优化预测准确性,删除包含湿度缺失数据的行。
2.2 疟疾传播风险分类
为了对疟疾传播率进行低风险或高风险分类,将疟疾传播比率特征的总数值分为两类:
- 类别 1:[min_ratio, min_ratio + r],表示低风险疟疾传播水平区间。
- 类别 2:[min_ratio + 2 * r, ma
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



