之前的一篇博客对PCA的原理、特点进行了介绍以及用python实现了PCA
。本篇博客对PCA
和Robust PCA
进行简单的区别。
1.PCA
主成分分析(PCA
)可以有效的找出数据中最重要的元素和结构,去除噪音和冗余,能将原有的复杂数据进行降维。最简单的主成分分析方法就是PCA
,从线性代数的角度看,PCA
的目标就是使用另一组基去重新描述得到的新的数据空间,通过这组新的基,能揭示与原有的数据间的关系,即这个维度最重要的“主元”。PCA
的目标就是找到这样的“主元”,最大程度的去除冗余和噪音的干扰。
2.Robust PCA
与经典PCA
一样,Robust PCA
(鲁棒主成分分析)本质上也是寻找数据在低维空间上的最佳投影问题。当观测数据较大时,PCA
无法给出理想的结果,而Robust PCA
能够从较大的且稀疏噪声污染的观测数据中恢复出本质上低秩的数据。Robust PCA
考虑的是这样一个问题:一般的数据矩阵D包含结构信息,也包含噪声。那么可以将这个矩阵分解为两个矩阵相加:D = A + E
,A
是低秩的(由于内部有一定的