1、PCA的原理
-
设n维随机变量X, 其对应的协方差矩阵是C
-
-
基于正交矩阵P,对随机变量X做正交变换,得到变量Y,对应协方差矩阵为R,如下所示。
C是X的协方差矩阵,R是Y的协方差矩阵,二者都是一个对称矩阵 协方差矩阵的对角线以外的值都是n维变量各分量之间的相关性的度量值,当值为0时表示两个分量无关,即相互独立,此时我们得到的变量具有很好的统计特性,便于处理,即我们的目标是找到正交矩阵P使下式成立
即对C进行相似对角化处理,生成对角矩阵R
根据对称矩阵的性质可知,一定存在对角阵与C正交相似
此时,
- 对角矩阵R是矩阵C的对应特征值组成的对角阵,