基于预测可靠性估计校正电力负荷预测系统的流式预测
一、引言
在决策和专家系统中,准确预测动态数据流的值是一项具有挑战性的任务。这是因为数据流具有高流速、存储有限的特点,并且需要模型快速适应新数据。传统的监督学习模型旨在准确建模学习数据,同时对未参与学习过程的示例实现尽可能高的预测精度。然而,在线学习领域面临着更大的挑战,因为数据源具有开放性、高速流动和非平稳分布的特征。
在这种需求密集的环境中,我们没有足够的时间进行在线测试和在不同模型中进行选择,或者迭代优化它们。因此,我们提出了一种校正在线学习系统单个预测的方法,并将其应用于电力负荷需求预测问题。该问题需要增量模型实时持续进行预测。为了校正系统的回归预测,我们比较了两种方法:一是使用基于局部性的可靠性估计CNK进行校正,二是使用卡尔曼滤波器进行校正。我们使用神经网络和k近邻这两种回归模型,对这两种校正方法的性能进行了实证评估,实验针对预测下一小时、下一天(24小时)和下一周(168小时)的电力负荷这三种不同情况展开。
二、相关工作
(一)校正回归预测
在评估预测准确性时,常用的是平均准确性度量,如相对均方误差(RMSE)。但这些估计只能评估模型的整体性能,无法提供关于单个预测误差的局部信息。而可靠性估计(即对未见过示例的预测误差估计)则能提供更有用的信息。
此前,有人提出并评估了几种不同的回归预测可靠性估计方法。在九种与模型无关(即算法将底层模型视为黑盒)的可靠性估计中,CNK估计特别值得关注。它通过局部建模来估计预测误差,计算效率高,其值的符号能指示误差方向。我们利用CNK估计来估计数据流的预测误差,并将预测值修正为更准确的值。