用图像显示
PCA(主成分分析)python实现(附图):https://www.jianshu.com/p/4528aaa6dc48
matplotlib 绘图可视化知识点整理:http://python.jobbole.com/85106/
import numpy as np
import matplotlib.pyplot as plt
x=np.array([2.5,0.5,2.2,1.9,3.1,2.3,2,1,1.5,1.1])
y=np.array([2.4,0.7,2.9,2.2,3,2.7,1.6,1.1,1.6,0.9])
scaled_x=x
scaled_y=y
data=np.matrix([[scaled_x[i],scaled_y[i]] for i in range(len(scaled_x))]) #将x,y的值赋给data
plt.plot(scaled_x,scaled_y,'+') #显示最初的data(角朝上的三角形)
mean_x=np.mean(x)
mean_y=np.mean(y)
scaled_x=x-mean_x
scaled_y=y-mean_y #零初值化
plt.plot(scaled_x,scaled_y,'^',color='red') #显示零初值化后的x,y
data=np.matrix([[scaled_x[i],scaled_y[i]] for i in range(len(scaled_x))])
cov=np.cov(scaled_x,scaled_y) #x,y的协方差矩阵
eig_val, eig_vec = np.linalg.eig(cov) #协方差矩阵的特征值和特征向量
plt.plot([eig_vec[:,0][0],0],[eig_vec[:,0][1],0],color='yellow')
plt.plot([eig_vec[:,1][0],0],[eig_vec[:,1][1],0],color='yellow')
plt.show()
eig_pairs = [(np.abs(eig_val[i]), eig_vec[:,i]) for i in range(len(eig_val))]
eig_pairs.sort(reverse=True) #降序排序
feature=eig_pairs[0][1] #选取特征值最大的k个特征向量(k=1)
new_data_reduced=np.transpose(np.dot(feature,np.transpose(data))) #将原来的数据与经过筛选的特征向量组成的特征矩阵相乘,得到新的数据
plt.plot(scaled_x,scaled_y,'^',color='red')
plt.plot([eig_vec[:,0][0],0],[eig_vec[:,0][1],0],color='yellow')
plt.plot([eig_vec[:,1][0],0],[eig_vec[:,1][1],0],color='cyan')
plt.plot(new_data_reduced[:,0],[1.2]*10,'*',color='green')
plt.show()
eig_vec[:,
0
][
0
]的含义:eig_vec[:,0]表示第0列所有数据即arry[-0.73517866,0.6778734]T,eig_vec[:,0][0]表示arry的第0个数据即-0.73517866