机器学习在水资源管理与公交旅行时间预测中的应用及挑战
机器学习在水资源管理中的应用
在水资源管理领域,机器学习发挥着重要作用,但也面临着诸多挑战,尤其是模型不确定性和自动化机器学习(AutoML)带来的风险。
模型不确定性
设计机器学习模型时,预测的不确定性是一大风险,其来源多样,如数据不完整和模型设置问题。尽管当前机器学习模型能以惊人的高精度给出最可能的预测,但仍不能完全信任,特别是检测结果易因数据和模型的微小修改而改变。对于确定性模型,对不确定性进行建模并非易事。下面以水需求估计为例,分别介绍处理数据不确定性(随机不确定性)和模型不确定性(认知不确定性)的方法。
- 认知不确定性建模
- 首先在水力模型中,为估计水从位置 u 到位置 s 的旅行时间 τ 并计算在该时间 τ 到给定结束时间 ts 内的水量 Vu,s,创建了如下模型:
[
V_{u,s} = \int_{t_s - \tau}^{t_s} f_s(t)dt
]
其中,ts 是要预测的 s 点的给定结束时间,Vu,s 可通过水管连接拓扑、管径大小和长度获得,fs(t) 是时间 t 的瞬时流量。在实际中,fs(t) 只能以离散观测值形式采样,这里以每 15 分钟的流量数据为例,τ 可通过简单数学计算得到。但该模型忽略了需求的每日变化,从而产生了建模的不确定性。
- 为解决此问题,构建了贝叶斯线性模型,因其简单且能通过正态分布 N(·) 描述趋势和认知不确定性。模型中,将第 n 天 t 时刻观测到的特征记为 (x_{n,t} \in R^d),则模型可表示为:
[
f_n(t) = x_{
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



