工程师统计学习之时间序列分析与变点检测
1. 时间序列的频域分析
在实际应用中,时间序列可能会因外部影响或内部缺陷而产生振动。通过对比图 49 和图 50 左侧的子样本,仅通过目视检查很难看出差异。但比较右侧的频谱密度估计时,两个信号之间的差异就会立即显现出来,因为受干扰数据的频谱在 $\omega_d$ 附近有一个突出的额外峰值。
离散傅里叶变换(DFT)将信号 $Z_1, \ldots, Z_T$ 分解为弱相关且在高斯情况下弱依赖的项,其中 $A_k$ 衡量了第 $k$ 个分量对信号的贡献量。这类似于主成分分析,可从原始观测输入向量中提取有影响力的特征。
在基于时间序列观测的分类问题中,使用 $I_T(\delta_k), 0 \leq k \leq K$ 作为统计学习算法的输入,通常比使用强依赖的 $Z_t$ 能获得更好的性能。这里,对于 $K \ll T$,$\delta_k = \frac{2\pi k}{K}, 1 \leq k \leq \frac{K}{2}$ 构成了区间 $[0, \pi]$ 上的傅里叶频率网格,比原始的 $\omega_k$ 网格更粗,以降低输入向量的维度,并使考虑的周期图值更加独立。$K$ 作为用作特征的主成分数量,是学习方法的一个超参数。如果信号 $Z_t$ 的频谱分量的幅度和相移都很重要,也可以使用从 DFT $D_T(\delta_k)$ 导出的 $A_k, \Phi_k$ 作为输入。
2. 时间序列的预处理
为独立观测训练集开发的分类和预测统计学习方法,对于平稳且记忆较短的时间序列也能较好地工作。但在实践中,并非所有时间序列都满足这些条件,因此需要进行各种变换,使时间序列数据适合作为学习算法
超级会员免费看
订阅专栏 解锁全文
2317

被折叠的 条评论
为什么被折叠?



