时空聚类:疟疾预测与人体平衡数据分析
1. 疟疾预测的时空聚类研究
在疟疾预测领域,一种新的时空聚类方法被提出,旨在探索空间分辨率与预测准确性之间的权衡。
1.1 数据来源
研究以泰国塔克府塔松杨区的每周疟疾预测问题为例。该地区有66个村庄,疟疾流行。实验数据来自泰国国家电子疟疾信息系统,涵盖2012年和2013年(99周)每个村庄的每周显微镜确诊疟疾病例,共6579条记录,12800例疟疾病例(包括恶性疟原虫和间日疟原虫)。每个村庄每周的病例数从0到82不等,平均为2.1例。
1.2 实验设置
- 交叉验证 :使用10折交叉验证评估聚类对预测准确性的影响。为每一折的训练数据生成聚类层次结构,并为层次结构中的每个聚类生成预测模型。然后将相同的层次结构应用于测试数据,并在那里的聚类上测试预测模型。
- 预测技术 :选择线性回归、ARIMA和ARIMAX三种常用技术进行疟疾预测。由于先前的研究表明,滞后5周的地表温度对该地区的疟疾发病率有相当大的影响,因此在ARIMA和ARIMAX模型中纳入了该因素。
- 评估指标 :为了比较不同大小聚类的预测准确性,使用对称平均绝对百分比误差(SMAPE),其范围为0到100。
1.3 实验结果
| 聚类标准 | 平均AIC下降 | 平均SMAPE降低 |
|---|
超级会员免费看
订阅专栏 解锁全文
41

被折叠的 条评论
为什么被折叠?



