如何选择优质神经网络?验证与确认技术
1. 背景与问题提出
在大气污染物源定位系统中,传统的扩散模型需要通过似然函数引导的模型参数空间扫描算法,来使预测数据与观测数据(传感器位置的浓度)达到最匹配。这一过程需要进行数千次扩散模型运行,计算时间长,即使采用分布式系统,也难以实现城市环境下的实时重建。
为解决这一问题,可使用训练好的人工神经网络(ANN)替代扩散模型。ANN通过示例学习,经过良好训练后能快速解决任务,是实时工作系统的优秀工具。不过,ANN训练计算成本高,但训练完成后可高速估计污染物浓度分布。
以往研究虽证实ANN有替代扩散模型的潜力,但在验证ANN模型质量方面存在不足,标准性能指标如相关性R和均方误差等在评判ANN质量时存在局限性。因此,需要提出新的指标来验证ANN输出与目标在空间和时间上的动态一致性,并改进训练数据中零值占比较大时的ANN质量。
2. ANN模型
前馈神经网络(FFNNs)常用于预测和函数逼近。其第一层由代表输入变量的神经元组成,网络基于这些输入变量在输出层产生神经元。输入层和输出层之间是隐藏层。ANN的性能取决于所选架构,包括神经元数量、隐藏层数量和连接结构。
目标是训练ANN预测在特定释放场景下,特定时间和位置的污染物浓度。输入向量结构为:$Input_i \equiv {X_s, Y_s, Q, d, x, y, v, t}$ ,其中 $(X_s, Y_s)$ 是污染源坐标(域内以米为单位),$Q$ 是释放速率,$d$ 是释放持续时间,$v$ 是风向,$t$ 是释放开始后的时间。训练好的网络应返回输出神经元 $Output_i \equiv C_{S_j(x,y)}^i(t)$ ,
超级会员免费看
订阅专栏 解锁全文
816

被折叠的 条评论
为什么被折叠?



