环境数据的无监督分析:因子、经验正交函数与聚类
在环境数据的分析领域,因子分析、经验正交函数(EOF)以及聚类分析是非常重要的无监督分析方法。这些方法能够帮助我们从海量的数据中发现潜在的模式和规律。
1. 样本与因子分析基础
样本通常以列向量的形式呈现,比如一个样本 $s(i)$ 就是一组按列向量格式排列的数字。虽然烷烃数据集具有一维的组织形式,使得使用列向量很自然,但因子分析方法并不要求数据必须是一维组织的。样本可以具有二维或三维网格的自然组织形式,在应用因子分析方法时,只需将这些网格重新排列(“展开”)成列向量即可。
2. 案例研究:赤道太平洋海表温度数据集的 EOF 分析
2.1 数据获取与描述
赤道太平洋海表温度数据集是一个典型的例子。该数据集来自国际气候与社会研究所(IRI)数据图书馆的 CAC 平滑海表温度异常数据集。它是赤道太平洋某区域海表温度的二维网格时间序列,时间跨度从 1970 年 1 月到 2003 年 3 月,涵盖了太平洋特定区域(南纬 29° 到北纬 29°,东经 124° 到西经 70°,网格间距为 2°)每月的海表温度相对于该区域平均值的偏差。
2.2 数据结构与 EOF 分析
该数据集包含 399 个月度图像,每个图像有 2520 个网格点(经度 84 个,纬度 30 个)。在分析中,我们使用代表空间模式的因子和代表时间变化的载荷。样本矩阵 $S$ 有 399 行和 2520 列,每个因子(即经验正交函数,EOF)是一个长度为 2520 的向量,可折叠成 84×30 的温度值网格。
虽然总共有 399 个 EOF,但许多 EOF 的奇异值
超级会员免费看
订阅专栏 解锁全文
42

被折叠的 条评论
为什么被折叠?



