30、工程师统计学习之时间序列分析与变点检测

工程师统计学习之时间序列分析与变点检测

1. 时间序列的频域分析

在实际应用中,时间序列可能会因外部影响或内部缺陷而产生振动。通过对比图 49 和图 50 左侧的子样本,仅通过目视检查很难看出差异。但比较右侧的频谱密度估计时,两个信号之间的差异就会立即显现出来,因为受干扰数据的频谱在 $\omega_d$ 附近有一个突出的额外峰值。

离散傅里叶变换(DFT)将信号 $Z_1, \ldots, Z_T$ 分解为弱相关且在高斯情况下弱依赖的项,其中 $A_k$ 衡量了第 $k$ 个分量对信号的贡献量。这类似于主成分分析,可从原始观测输入向量中提取有影响力的特征。

在基于时间序列观测的分类问题中,使用 $I_T(\delta_k), 0 \leq k \leq K$ 作为统计学习算法的输入,通常比使用强依赖的 $Z_t$ 能获得更好的性能。这里,对于 $K \ll T$,$\delta_k = \frac{2\pi k}{K}, 1 \leq k \leq \frac{K}{2}$ 构成了区间 $[0, \pi]$ 上的傅里叶频率网格,比原始的 $\omega_k$ 网格更粗,以降低输入向量的维度,并使考虑的周期图值更加独立。$K$ 作为用作特征的主成分数量,是学习方法的一个超参数。如果信号 $Z_t$ 的频谱分量的幅度和相移都很重要,也可以使用从 DFT $D_T(\delta_k)$ 导出的 $A_k, \Phi_k$ 作为输入。

2. 时间序列的预处理

为独立观测训练集开发的分类和预测统计学习方法,对于平稳且记忆较短的时间序列也能较好地工作。但在实践中,并非所有时间序列都满足这些条件,因此需要进行各种变换,使时间序列数据适合作为学习算法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值