PCA就是主成分分析,这是个无监督的数据处理过程
目的是把原有的数据降低到一个比较小的维度,便于后续的处理
整个过程的理论是:
原有m个样本,每个样本为n维向量,那么可组成一个n*m的矩阵S
找到一个矩阵A,将上面的样本矩阵映射到A中,假设A为k*n的矩阵
矩阵映射过程就是A矩阵左乘S矩阵得到矩阵E, 那么E为k*m的矩阵
如果k<<n的话,那么就成功的把n维向量映射到了k维向量中,这里的问题就是这个基矩阵A是如何找到的
主要使用的方法就是方差尽量大,而且还要不相关,所以既要使用方差又要使用协方差
贴一篇写的很好的博客:http://blog.codinglabs.org/articles/pca-tutorial.html
其实这里对矩阵的理解还是比较关键,有兴趣的同学可以看上面博客的内容
有两个矩阵很有用,协方差矩阵和拉普拉斯矩阵,有空再分析