库得克
第1节 建模
孩子们玩模型飞机,大人们开飞机。
1 结论:建模总是会出错
Covid-19疫情期间,专家们利用人工智能(AI)、机器学习(ML)、预测分析(PA),尤其是各种建模,证明病毒的猖獗和致命性。
建模、人工智能、机器学习和预测分析各有其用途。例如,它们可以从学术角度深入分析不同缓解措施的影响,而直接实验则无法实现这一点。在Covid-19疫情之外,只要对建模进行适当调整,直至获得理想结果,它们在预测方面便能发挥巨大作用。
建模、人工智能、机器学习和预测分析存在局限性,它们不适合用于改变人生的决策,它们只应用于对可能情景的学术洞察。
建模无非是一种数学尝试,旨在以易于管理的形式表示现实,以供各种用途,如上文所述。它们依赖于建模开发者以数学和算法的方式反映生活的能力。有些建模比其他建模更好。建模取决于应用场景以及在不作假设的情况下,以数学方式表示生活的难易程度。
因为生命无法用数学来精确表示,所以建模总是存在误差。这一观点已被传统科学界所接受,但遗憾的是,在如今这个受“炒作”影响更大的社会中,这一观点并未被广泛接受。
被誉为“20世纪最伟大的统计学家之一”的George E. Box曾说过一句名言:“所有建模都是错误的”,尽管它们可能有用。
https://en.wikipedia.org/wiki/George_E._P._Box
失败教训
*全球各国封锁措施所依据的预测数据来自专家尼尔·弗格森教授和伦敦帝国理工学院。以下是弗格森教授的简要经历:2001年,尼尔·弗格森教授和伦敦帝国理工学院对口蹄疫进行了建模分析,建议即使没有感染证据,也应扑杀动物。这一建议导致超过六百万头牛、羊和猪被全部扑杀– 这给英国经济造成了约100亿英镑的损失。弗格森对口蹄疫的建模是“存在严重缺陷”,并“忽视了农场的物种构成”,犯下了“严重错误”。2002年,弗格森预测多达5万人将因接触疯牛病而死亡。在英国,仅有177人死于疯牛病。2005年,弗格森预测多达2亿人可能死于禽流感。最终,仅有282人……*
如果所有建模都是错误的(事实上它们确实如此),那么它们就不能被用作证据来说服公众,让他们相信通过控制措施挽救了多少生命。
2 错误建模的示例
2.1 澳大利亚维多利亚州的Covid-19建模
数字事实
- 瑞典未实施封锁时的平均值是44每日死亡人数。若根据维多利亚州的人口规模进行调整,每日20人死亡,远不及每日650人。
- 在死亡高峰期未实施封锁的日本,平均每天死亡17人。若根据维多利亚州的面积进行调整,即每天死亡1人,远不及每天650人。
- 韩国在未采取大规模物理隔离措施的情况下控制住了第一波疫情,而是通过追踪接触者来控制疫情。在疫情高峰期,韩国平均每天约有7人死亡。若根据维多利亚州的人口规模进行调整,则每天死亡人数不到1人。
为了进行比较,关于Covid-19导致数千人死亡(未采取物理隔离措施)的声明中提到了意大利和美国等国家。以下是这些国家的统计数据。
- 在死亡高峰期,美国平均每天有1900人死亡。若根据维多利亚州的人口规模进行调整,即每天37人死亡,远不及每天650人。
- 意大利在高峰期平均每天有668人死亡。若按维多利亚州的人口规模进行调整,即每天70人死亡,远不及每天650人。
“正如我们所深知,另一种选择是成千上万的人死亡,出现我们在世界其他地方见过的那种可怕场景。”
“理论建模显示,如果不实施保持社交距离的限制措施,维多利亚州将有约3.6万人死于Covid-19。”
“建模显示,在各州Covid-19疫情高峰期,如果没有物理隔离措施,每天可能会有650人死亡。”
“保持距离的措施”
事实表明,建模无法用于估算死亡人数。涉及的因素太多。每个国家都是独一无二的。在未采取严格物理隔离措施的国家中,没有一个国家在高峰期达到了预测的死亡人数。许多采取了物理距离措施的国家,如意大利,死亡率反而更高。当然,有人可能会说他们做得不对,而美国显然只是半心半意地采取了物理距离措施。但是,真的可以说只有我们做得对吗?难道其他国家就做不到吗。
建模、人工智能(AI)、机器学习(ML)、预测分析(PA)是常被大肆宣传的技术,用以表明形势的紧迫性,尽管这些技术在学术上有用,但都不应被用作社会活动决策的依据,因为它们总是错误的。关于机器学习,机器并不能学习。学习是由程序员模拟的。一些机器学习算法甚至是由300年前的技术组成的,仅仅因为使用了“建模”一词,并不意味着使用了能够提供神奇解决方案的尖端技术。
例如——
根据上述情况,“理论建模显示,如果不实施保持物理距离的限制措施,维多利亚州将有约3.6万人死于冠状病毒。”
36000是如何得出的?使用了什么建模?这个建模有多复杂?
这个数学建模一点也不复杂。
死亡人数 = 维多利亚州人口 * 感染比例 * 感染者中的死亡比例。
维多利亚州的人口约为600万。通常假设的感染率为60%。在声明发布时,通常假设的死亡率是1%(也有报道称死亡率更高)。因此,死亡人数=600万*0.6*0.1=3.6万。
问题在于建模的参数。60%的感染率并不罕见,比如普通感冒。假设这60%中1%会死亡是有缺陷的。这1%是基于病例死亡人数得出的。这是一个最坏情况的假设,没有考虑到无症状病例。
如本报告后文所述,%的死亡病例并不能真实反映病毒的致命性。
2.2 复杂建模
George E. Box 名言
“既然所有建模都是错误的,科学家就无法通过过度详尽的阐述来获得一个‘正确’的建模。相反,他应该遵循英国哲学家 William of Occam的观点,寻求对自然现象的经济描述。正如设计简单但富有启发性的建模的能力是伟大科学家的标志一样,过度详尽和过度参数化往往是平庸的标志。”
https://en.wikipedia.org/wiki/All_models_are_wrong
然而,过度参数化很难定义。理论上,复杂的世界需要一个复杂的建模。但在实践中,建模越复杂,越容易出错。一些建模,如“澳大利亚Covid-19疫情传播与控制建模”和“第13号报告:估算11个欧洲国家Covid-19感染人数及非药物干预措施的影响”中所述的建模,显然较为复杂,因此更容易出现显著的输出误差。
https://arxiv.org/abs/2003.10218
https://www.imperial.ac.uk/media/imperial-college/medicine/sph/ide/gida-fellowships/Imperial- College-COVID19-Europe-estimates-and-NPI-impact-30-03-2020.pdf
这些建模假设的学术分布在此次疫情中并不真实。几乎每个国家都有不同的分布,没有哪个国家遵循建模中通常假设的整齐学术分布,如指数曲线、逻辑曲线或负二项分布。没有一个建模考虑了检测规模对病例的影响。所有建模都对病例死亡率做出了过多假设。所有建模都过于学术化地处理现实。在教室里想象现实是一回事,在现实生活中看到现实又是另一回事。没有一种方法考虑到了影响案例的测试规模,这些错误假设对结论的影响程度无法确定,因为我们不了解所用算法的详细情况。这里要说的是——
- 所有建模都是错误的
- 没有任何建模能准确反映现实
- 基于建模来陈述挽救了多少生命是不科学的,因为建模无法被证明是正确的。
- 根据总是错误的建模来决定社会活动,这在道德上是错误的。
2.3 案例研究——用于证明维多利亚州/澳大利亚第三阶段封锁合理性的建模
维多利亚州经历了澳大利亚最严格的封锁措施,然而,封锁结束后,病例数量再次激增,给民众带来了更多困难,并使经济进一步陷入停滞。
如世界各地已成常态,建模被用来为行动提供依据。
标题写道
“维多利亚州7月份实施的第三阶段封锁措施避免了多达37,000例冠状病毒病例,挽救了1,258人的生命。”
研究发现,维多利亚州墨尔本的xxx研究所(为尊重该机构,我们不在公开场合透露其名称)使用了基于指数增长假设的“建模”来得出上述结论。我们决定自行分析该结论的依据。
基于下文所述原因,我们无法认同该建模的结论。
根据论文所述,所用数据来源于维多利亚州卫生与公共服务部。
图6.0展示了使用我们的技术应用于实际案例时所识别的三种趋势,这些案例所使用的数据与xxx研究所使用的数据相同。无论我们使用何种技术都无关紧要,因为从视觉上很容易看出实际点是如何紧贴线条的。对于案例发生的随机过程,预期会出现变异性的增加。

图6.0 6月14日至8月2日期间应用于维多利亚州病例的趋势识别技术
图6.0中的实际数据显示,没有证据表明第三阶段减缓了报告病例的日增长。趋势表明斜率并未如预期那样中断。
用于证明封锁措施合理性的建模假设病毒呈指数级增长。但如图6.1所示,并未出现指数级增长。在理想情况下,病毒可能在教室中呈指数级增长,但维多利亚州的情况并非教室环境。

图6.1 线性段,无指数增长。
人们可以发挥想象力,将第1节和第2节近似地用指数曲线表示,如图6.2所示,但发挥想象力并不是一个科学的过程。

图6.2. 一条拟合的指数曲线。
如果我们根据图6.2中的曲线进行推断,那么看起来接下来的病例和死亡人数会大幅增加。但事实并非如此。
xxx研究所采用指数曲线,以10为底绘制了对数,并得到了如图6.3所示的图表。

图6.3 报告的每日病例数对数图
参考图6.3,可以观察到两个部分。一部分是蓝色斜率,另一部分是红色斜率。由于对数的斜率是线性的,xxx研究所假设了两种指数增长曲线。一种是在封锁之前,另一种是在封锁之后。
附录A.3表明,线性对数转换后的线条并不能证明指数增长。他们利用这一错误信息来计算避免的病例数,并得出结论
研究发现,维多利亚州 7 月份实施的第三阶段封锁措施避免了多达 37,000 例Covid-19病例,挽救了 1,258 条生命
然而,第三阶段封锁并未显示出明显效果
3953

被折叠的 条评论
为什么被折叠?



