核经验正交函数(Kernel EOFs):原理、应用与拓展
1. 背景
大气大尺度流动因系统动力学的非线性而处于非线性流形上,但可将该流形嵌入高维线性空间。系统可能存在多个子结构,识别和分离这些子结构属于模式识别领域。在天气和气候研究中,由于其复杂非线性,输入空间中的模式或相干结构不易分离。此时,可尝试将系统数据嵌入“特征空间”,通过非线性变换 φ(.) 简化复杂关系,使判别更高效。
例如,对于具有多项式非线性的数据,将其转换到包含构成非线性多项式的所有单项式的特征空间,可简化初始复杂关系。如二维输入空间 (x1, x2) 存在二次非线性,考虑所有次数小于 3 的单项式得到的五维空间 (x1, x2, x1², x2², x1x2) 可拆解初始复杂关系。不过,一般情况下分离并非易事,不同组之间的超曲面可能是非线性的,但仍可实现分离。
核EOF方法(或核PCA)的目标是找到一种嵌入或变换,以实现更轻松的判别或模式识别。该方法还可扩展到其他相关方法,如主振荡模式(POPs)或最大协方差分析(MCA)。核PCA在大气科学中应用较晚,早期研究表明其比传统PCA能更准确地捕捉数据本质。
2. 核EOF的原理
2.1 核EOF的公式推导
设 xt(t = 1, …, n)是 p 维零均值时间序列样本,协方差矩阵为 S。核EOF方法是一种非线性EOF分析,基于将输入数据空间通过非线性变换 φ(.) 映射到特征空间 F 进行EOF分析。若 φ(xt) = ξt,则核EOF是新变换数据的EOF。特征空间 F 的协方差矩阵 S 计算如下:
[S = \frac{1}{n} \sum_{t=1}^{n} \xi_t \xi_
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



