Learning from Polar Representation: An Extreme-Adaptive Model for Long-Term Time Series Forecasting
在本文中,并提出了距离加权自动正则化神经网络(DAN),这是一种通过极表示学习增强的新型极端自适应模型,用于对流进行远程预测。 DAN 利用距离加权多重损失机制和可堆叠块从外源数据中动态细化指标序列,同时还能够通过采用高斯混合概率模型来处理单变量时间序列,以提高对严重事件的鲁棒性。我们还引入了 KruskalWallis 采样和门控制向量来处理不平衡的极端数据。在四个现实水文径流数据集上,我们证明 DAN 显着优于最先进的水文时间序列预测方法和为长期时间序列预测设计的通用方法。
贡献:
我们提出了一种距离加权自动正则化神经网络(DAN),它使用可扩展的块来动态促进长期预测。
为了提高模型对严重事件的鲁棒性,DAN创新性地使用距离加权多重损失方法同时从时间序列中提取极坐标表示。
我们引入了 Kruskal-Wallis 抽样策略来处理不平衡的极端数据和门控制向量,以提高指标适应不平衡数据的辨别能力。
距离加权自动正则化神经网络:
GMM 指标。
在我们的工作中,当没有提供异常指标序列时,我们使用高斯混合模型,从输入单变量时间序列中学习一组分布。然后,我们根据 GMM 模型拟合过程中学习到的权重,计算时间序列中每个值的指标特征,作为所有分量概率的加权和。
时间序列中的 Kruskal-Wallis 检验。
目的:为了平衡极端事件的稀疏分布,我们采用 Kruskal-Wallis 检验 (39) 作为非参数方法来评估训练样本的正态性并指导我们的过采样策略。 Kruskal-Wallis 检验根据中位数检查两组或多组时间序列,其中首先对数据进行排名,然后计算每组的排名总和。然后根据这些排名总和计算 H 值,并与临界值进行比较,以确定各组之间是否存在显着差异。
由于 Kruskal-Wallis 检验不假设特定分布,因此有时称为无分布检验 。 H 值计算如下
H = 12 n ( n + 1 ) ∑