1.鸢尾花数据集降维(原始数据集维度是4,降维后数据集维度是2)
import matplotlib.pyplot as plt
import numpy as np
from sklearn.decomposition import PCA
from sklearn.datasets import load_iris
import pandas as pd
data = load_iris() # 以字典形式加载鸢尾花数据集
y = data.target # 使用y表示数据集中的标签
X = data.data # 使用X表示数据集中的属性数据
pca = PCA(n_components=2) # 加载PCA算法,设置降维后主成分数目为2
reduced_X = pca.fit_transform(X) # 对原始数据进行降维,保存在reduced_X中
print("降维前:",X.shape)
print("降维后",reduced_X.shape)
结果:
降维前: (150, 4)
降维后 (150, 2)
2. 对比特征值特征向量
import matplotlib.pyplot as plt
import numpy as np
from sklearn.decomposition import PCA
from sklearn.datasets import load_iris
import pandas as pd
data = load_iris() # 以字典形式加载鸢尾花数据集
y = data.target