PCA(principal Component Analysis) 主成分分析
本文解决以下疑问:
1、什么是PCA?
2、为什么要求最大特征值?
3、为什么要投影到对应的特征向量?
——————————————————————————————————————————
1、什么是PCA?
有两种经常使⽤的PCA的定义,它们会给出同样的算法。这里讲第一种定义。
PCA可以被定义为数据在低维线性空间上的正交投影,这个线性空间被称为主⼦空间(principal subspace),使得投影数据的⽅差被最⼤化(Hotelling, 1933)。等价地,它也可以被定义为使得平均投影代价最⼩的线性投影。平均投影代价是指数据点和它们的投影之间的平均平⽅距离(Pearson, 1901)


2、为什么要求最大特征值?

此处的求偏导根据《Matrix cookbook》中公式:

PCA(主成分分析)是数据在低维线性空间上的正交投影,目标是最大幅度地保留数据的方差。通过求最大特征值和对应的特征向量,实现数据的相关性削弱和信息集中。该方法在《PRML》和《Matrix cookbook》中有详细阐述。
最低0.47元/天 解锁文章
1704

被折叠的 条评论
为什么被折叠?



