概念
主成分分析法就是提取样本的特征值,将多个特征转化为少数几个特征,以便达到降维样本的目的,这样可以简化样本的数据,更容易理解以及在平面表示
用法
1、降维数据,数据压缩,方便计算,也方便理解和在三维,或者二维平面画图
2、降噪,能减少数据中一些非必要的噪点的影响
原理
如下图,给出蓝色点,需要找出一条向量,跟所有的点的距离是最小的,同时所有点映射在这个向量的点,距离是最大的,因为只有这种映射的点距离最大,才容易区分出每个点的特征,这种主成分分析才是最成功的
那图中也讲到,映射的点距离要大,那么说明这些映射的点的方差要大,那么如何计算呢
1、先去均值,也就是所有点都要减去均值,这样这些点的均值为0
2、求映射的点的方差最大化
最终计算结果: