几种简单的数据降维方法以及demo
PCA——主成分分析法
PCA是主成分分析法,为无监督的线性降维法。减去某些相对而言权重不那么高的特征。
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn import datasets
digits = datasets.load_digits()
features = StandardScaler().fit_transform(digits.data)# 归一化加训练
# PCA做主成分分析,其中whiten是白化,判断每个特征的偏差是否一致;
# n_components的取值为0-1之间的浮点数时,表示希望保留的信息量的比例。
pca = PCA(n_components=0.99, whiten=True)
features_pca = pca.fit_transform(features)
print("Original number of features:", features