1 维度压缩
主成分分析(rincipal components Analysis)
在减少数据集的维度的同时,保持对方差贡献最大的特征
2 PCA方法
pca_3=PCA(n_components=3) 维度设置
fit 训练数据
data_pca_3=pca_3.fit_transform(data)
3 代码案例事例
import pandas
from sklearn import datasets
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA
from mpl_toolkits.mplot3d import Axes3D
# d加载库里边的iris数据集
iris=datasets.load_iris()
# 选择自变量和因变量
data=iris.data
target=iris.target
# 选择维度并进行训练
pca_3=PCA(n_components=3)
data_pca_3=pca_3.fit_transform(data)
"""
散点样式:
参数 样式
'.' 实心点
'o' 圆圈
',' 一个像素点
'x' 叉号
'+' 十字
'*' 星号
'^' 'v' '<' '>' 三角形(上下左右)
'1' '2' '3' '4' 三叉号(上下左右)
颜色:
参数 颜色
'b' 蓝
'g' 绿
'r' 红
'c' 青
'm' 品红
'y' 黄
'k' 黑
'w' 白
"""
### 定义颜色和三点样式
colors={
0:'r',
1:'b',
2:'k'
}
markers={
0:'X',
1:'D',
2:'o'
}
# 弹出图形 %matplotlib qt
# 调用三维数据