高效水基础设施管理中的机器学习应用
1. 水质影响因素分析
在水质分析中,对各项因素的重要性进行了评估。结果显示,各因素按递增顺序排名,每个因素所呈现的性能是其左侧所有因素的组合。以历史平均氯含量作为预测的基线误差,代表去除所有因素,此时误差最大。
从结果可知,水库总氯含量和水库温度这两个因素能捕捉下游氯含量超过 90% 的变化情况,仅这两个因素就能减少约 50% 的总误差。其他因素的影响则小得多,而浊度几乎不能提供额外信息。
2. 提高生产力的机器学习模型
数据建模是预测、回归、分类和预测等任务的核心部分,主要有参数模型和非参数模型两种选择。
2.1 参数模型与非参数模型对比
- 参数模型 :参数模型将所有信息包含在参数中,假设数据分布可以用有限的一组参数来定义。通过选择具有固定参数集的函数形式,这些方法受到指定形式的高度约束。以水管道故障预测为例,使用韦布尔过程(Weibull process),当将管道使用年龄 t 作为输入时,目标是通过 $\lambda(t) = f (t) = at^b$ 来学习强度 $\lambda$,该函数呈幂曲线形状,其假设基于事件发生频率随时间/年龄增加的事实。
- 非参数模型 :不对映射函数形式做强假设的算法称为非参数机器学习算法。它们可以从训练数据中自由学习任何函数形式。非参数模型,如随机森林和深度学习模型,已在各个领域得到应用,并用于解决许多具有挑战性的机器学习任务。虽然名为非参数模型,但实际上需要大量参数来构建。对于相同的问题,非参数模型不假设像参数模型那样的固定函
机器学习在水务管理中的应用与风险
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



