PCA能做的事其实很有限,那就是:降维。越降维,维度就会越有意义。
下面说明PCA做法
首先这里有n行样本,每行样本有m个特征,我们想把它压缩成k个特征。
然后求出每列的均值,然后用每列减之。
然后求这个矩阵的列协方差矩阵(m*m的矩阵了)。
然后求这个协方差矩阵的特征值,一共m个。
我们挑取前k个,算出其特征向量,组成m*k的矩阵。
然后用被减去均值的矩阵乘之,就是最后的结果。
最后就是这样的算法。
本文介绍了一种常用的降维方法——主成分分析(PCA),详细解释了PCA的具体步骤:包括数据预处理、计算协方差矩阵、求解特征值及特征向量等,并给出了最终的降维结果。
PCA能做的事其实很有限,那就是:降维。越降维,维度就会越有意义。
下面说明PCA做法
首先这里有n行样本,每行样本有m个特征,我们想把它压缩成k个特征。
然后求出每列的均值,然后用每列减之。
然后求这个矩阵的列协方差矩阵(m*m的矩阵了)。
然后求这个协方差矩阵的特征值,一共m个。
我们挑取前k个,算出其特征向量,组成m*k的矩阵。
然后用被减去均值的矩阵乘之,就是最后的结果。
最后就是这样的算法。
513
594
3026
457
3849
1796

被折叠的 条评论
为什么被折叠?