一、简介
这篇文章简单介绍了PCA的原理、思想和一些定义,本文将介绍如何用python进行PCA。
二、实现
2.1 标准化数据
在对数据进行PCA前,需要先将数据进行中心标准化,即使特征的平均值为 0 0 0,方差为 1 1 1。
from sklearn.preprocessing import StandardScaler
StandardScaler(*, copy=True, with_mean=True, with_std=True)
使用说明:
- 实例化:
scaler = StandardScaler()
- 训练:
scaler.fit(data)
,可接着使用scaler.mean_
得到每列的均值,使用scaler.scale_
得到每列的标准差 - 转换:<