目录
一、预测确诊患者数量的机器学习算法
1. 最小二乘准则(LSE)预测
可以利用回归算法对确诊患者进行预测,有线性回归和非线性回归,根据SIR模型等一般的疫情传播模型。S 类,易感者,指未得病者;I 类,感病者,指染上传染病的人;R 类,康复者,指被隔离或因病愈而具有免疫力的人。
线性回归明显是不符合整体疫情的走势,这里不做讨论。同时SIR模型对人群的分类不够细致,没有考虑政府等人为干预的情况,且模型中未引入反馈机制,所以需要对SIR模型进行改进来进行预测。因此在这里先利用最小二乘准测(least square error, LSE)和梯度下降算法对数据进行非线性回归,预测天数和患者数量的非线性关系[1]。最小二乘准则的基本思路是使得所有样本点到曲线或者面的距离最小。梯度下降主要是通过迭代找到最小二乘准则的损失函数的极小值。
根据疫情传播和发现疫情后的干预,可以将疫情分为两个阶段:
第一阶段就是疫情的自然传播阶段,增长接近指数增长,假设第一天患者数量为n基本再生数为k,则第二天新增感染患者数量为nk ,第三天为
,依次类推,第t天的感染患者数量为:
,k作为基本再生数,n为初始感染人数,t为天数。
第二阶段,疫情传播的渠道被逐渐切断,传染源被逐渐控制,易感人群得到保护,这些措施干预了自然传播,降低了基本再生数k。对疫情的管控力度越大,基本再生数k就越小。根据SIR模型,当k小于1时,传染病才可被控制住。假设在第 天,开始实现严格管控,再生数k小于1,则可以得出:

最低0.47元/天 解锁文章
10万+





