急性呼吸道感染建模中的数据不确定性处理与巴西结核病研究网络实时数据质量分析
1. 流行病学数据的不确定性量化
在流行病学建模中,数据的不确定性是一个关键因素,它对建模输出的准确性有着重要影响。以下是一些主要的不确定性来源:
- 输入数据相关的不确定性 :
- 发病率数据中的噪声。
- 国家节假日期间历史记录缺失、数据稀缺导致的偏差。
- 周末期间病例报告不足。
- 不能反映疫情趋势的不合理数据。
- 可测量或不可测量的混杂因素。
由于这些因素的复杂性,很难估计最终的误差结构,因此常使用基于已知概率分布的合成误差结构模型。
在相关研究方面,有多种方法来感知和解释与输入数据相关的模型参数的不确定性:
- Valero和Morillas使用基于发病率数据重采样的自助法,因为发病率数据对建模过程的不确定性影响最大。
- Chowell提出的从最佳拟合模型解进行参数自助法,该方法已在一些研究中成功用于表征模型参数的不确定性。
为了建模输入数据的不确定性,可采用以下误差结构:
- 泊松误差结构 :是最流行的误差模型之一。Chowell描述的建模框架通过生成具有泊松分布的随机值引入偏差,该分布的均值等于固定时间步内新登记感染病例的数量。在实际应用中,可将其应用于每周发病率数据集。
- 负二项误差结构 :可用于建模数据中较高的方差水平,因为在这种情况下,均值和方差可以独立设置。对于存在过度离散的情况,该结构能更好地表示实际数据。
- 零截
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



