疫情追踪的数据科学基础
卡内基梅隆大学统计学与机器学习副教授、某机构学者Ryan Tibshirani是Delphi研究组的联合首席研究员。该团队于2020年3月启动了COVIDcast项目——美国最大的新冠肺炎活动实时指标数据库,包含多维度地理细粒度数据。
技术架构与数据管道
疫情爆发前团队专注于季节性流感预测。疫情后转向新冠肺炎研究,核心工作是构建和维护COVIDcast的完整数据管道:
- 整合多元实时数据源(部分数据源依赖团队开发才得以公开)
- 开发即时预测(nowcasting)和 Forecasting 模型
- 数据被公共卫生官员、政府机构及金融机构常态化使用
机器学习与公共卫生协作
团队与某公共卫生中心合作开发集合模型(ensemble model),整合COVID预测中心提交的多源数据。技术实践表明:
- 疫情数据分辨率远超传统流感数据
- 数据治理存在重大挑战与机遇并存
- 计算科学家在疫情防控中扮演关键角色
流行病预测的未来发展
全球对疫情追踪的关注度空前提升,未来重点包括:
- 建立永久性流行病应对基础设施
- 将流行病预测打造为与天气预报同等重要的公共服务
- 扩展技术应用范围至其他快速传播的流行病领域
(可于某中心机器学习峰会观看完整技术演讲)
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码

2698

被折叠的 条评论
为什么被折叠?



