1.主成分分析PCA降维
接口:sklearn.decomposition.PCA(n_components = None)
传参:n_components 传参为小数时 表示保留百分之几的信息;
传参为整数时表示减少到多少维度的数据集
PCA降维最理想的效果是:即极大程度上的降低了数据集的维度,又保留了最多的数据集的message
code:
transfer = PCA(n_component = 2)
# 将数据集中的特征值降低为2维的数据
transfer = PCA(n_component = 0.95)
# 将数据集中的数据进行降维效果的处理,并保留百分之95的数据信息
datanow = transfer.fit_transform(data)
# data:需要进行降维的数据, datanow = 降维后的数据集
一般的流程:
1.get data_set
2.合并表(判断相关性的特征)
3.找到相关性之间的关系
4.PCA降维