利用近实时卫星降水数据和机器学习改进极端径流建模
1. 引言
在水资源管理中,基于物理的降水 - 径流模型通过平衡和守恒方程描述流域内的物理过程。然而,这些模型需要大量数据,还可能存在过度参数化问题,限制了其实际应用价值。
近年来,数据驱动的机器学习(ML)技术在水文学家中受到广泛关注。ML 能够利用现有相关信息(如降水、过去的径流)来建立与目标变量(径流)的关系,而无需了解潜在的物理过程。不过,除了提供准确的水文模拟外,使用 ML 推断水文系统内的过程也受到了不少质疑。有人认为,理解系统中的驱动过程可以使 ML 模型在训练数据范围之外模拟水文响应,甚至将模型应用于类似的无测站系统。
在 ML 技术中,随机森林(RF)算法因其简单性(需要校准的参数少)、较高的准确性、模型鲁棒性以及处理小样本和复杂数据结构的能力,被水文学家广泛用于径流建模,包括与低概率发生相关的极端径流模拟。
在数据获取方面,许多地区的地面降水监测网络要么不存在,要么非常稀少,山区情况尤为明显。幸运的是,遥感(RS)产品的发展显著提高了降水观测的数量和质量。但单颗卫星的 RS 降水数据难以提供准确估计,因此多卫星降水产品应运而生,如 NASA 的 IMERG 和 PERSIANN 产品。这两种产品具有准全球覆盖、免费访问、高时空分辨率和持续发展的特点,广泛应用于水文气象领域。
解决数据可用性问题后,有两个研究问题需要解决:一是 RS 数据能否很好地代表降水情况;二是在极端径流 ML 模型中,能否提高 RS 降水数据的同化效果。对于第一个问题,可以通过将 RS 产品与地面降水估计进行验证来解决;对于第二个问题,在没有地面站验证 RS 图像的情况下,可以利用 ML 算法(如 R
超级会员免费看
订阅专栏 解锁全文
56

被折叠的 条评论
为什么被折叠?



