时间序列缺失值填充与低秩逼近方法解析
1. 缺失值填充的基本条件
在进行缺失值填充时,被填充组件的近似可分离性是成功填充的必要条件。对于完全分离的组件,缺失值可以无误差地重建。同时,缺失数据的位置对于子空间方法进行填充的可能性至关重要,因为非缺失值的数量应足够大,以通过形状奇异谱分析(Shaped SSA)实现可分离性。至少,完整滞后向量的数量应大于被填充时间序列组件的秩。
2. 迭代填充方法
2.1 迭代方法原理
迭代填充缺失值是一种自然且简单的思路。首先,使用一些合理的值填充缺失项,然后通过更新对象底层结构的奇异谱分析(SSA)近似来迭代改进这些值。该方法最初用于有噪声的秩亏矩阵的缺失值填充,后来被扩展到时间序列。
对于秩亏矩阵,其结构由秩定义,因此通过奇异值分解(SVD)进行改进,其中前 r 个 SVD 分量描述了该结构。有限秩 r 的时间序列可以表示为其轨迹矩阵,该矩阵秩为 r 且是 Hankel 矩阵。因此,可以借助轨迹矩阵的 SVD 并进行 Hankel 化来实现改进,这实际上就是基本的 SSA 算法加上重建步骤。如果序列是平稳的,或者部分了解序列模型,也可以在迭代中使用 Toeplitz SSA 或带投影的 SSA。
在每次迭代中,将改进后的值插入缺失项的位置,并将非缺失项的位置恢复为最初使用的数据。最初使用的数据有两种类型:一是使用原始值;二是如果可以应用 Shaped SSA,则可以使用重建值代替原始值。
2.2 迭代方法的优缺点
该方法可以形式上应用于几乎任何位置的缺失值。然而,数值实验表明,如果缺失数据位于时间序列的两端,迭代方法可能会失败。此外,
超级会员免费看
订阅专栏 解锁全文
8722

被折叠的 条评论
为什么被折叠?



