时间序列分析中的滤波与预测技术
1. 预测未来
在时间序列分析里,我们可把时间序列 $d$ 的当前值近似成其过去值的线性函数,公式如下:
$d_i = p_2d_{i - 1} + p_3d_{i - 2} + p_4d_{i - 3} + \cdots + p_Md_{i - M - 1}$
要是知晓这些系数 $p$,就能借助过去值 $d_{i - 1}, d_{i - 2}, d_{i - 3}, \cdots$ 来预测当前值 $d_i$。此方程实则为卷积方程:
$p_1d_i + p_2d_{i - 1} + p_3d_{i - 2} + p_4d_{i - 3} + \cdots = 0$,其中 $p_1 = -1$,即 $p * d = 0$。
卷积方程 $p * d = 0$ 和之前遇到的热生成方程 $g * h = u$ 形式相同,可运用广义最小二乘法来求解。先验信息 $p_1 = -1$ 被假定是极为确定的,其方差比 $p * d = 0$ 小得多。
以纽斯河水位图为例,我们用两种方法计算预测误差滤波器,得到了相同结果。选取 $M = 100$ 作为 $p$ 的长度,滤波器大部分高幅值集中在前 3 到 4 天,这表明较短的滤波器或许也能得出类似的预测结果。42 天处的小特征出乎意料,这意味着当前值可能和一个多月前的时间存在某种关联,但该特征对预测的实际改善程度还有待研究。
预测误差 $e = p * d$ 十分有趣,它包含了无法从过去预测出的当前部分,也就是新信息。在这个例子中,纽斯河水位图不可预测的部分或许是风暴模式,而可预测的部分则是河流对这些风暴的响应。误差 $e$ 中的窄尖峰和流量峰值相关,似乎证
超级会员免费看
订阅专栏 解锁全文
526

被折叠的 条评论
为什么被折叠?



