RGB三色图的每一个像素在三维空间是一个点,我们对这些点进行主成分分析,将图片投影到一维主轴。
import numpy as np
import cv2
from scipy import linalg
img = cv2.imread("shan.jpg",cv2.IMREAD_COLOR)
cv2.imshow("original", img)
nrows, ncolumns = img.shape[0:2] # 获取图片的行数与列数
imgArrT = np.array(img, dtype=np.int64).reshape(-1, 3) # 每行是一个像素点
mean = np.mean(imgArrT, axis=0) # 求所有像素点的平均值
CenterImg = imgArrT - mean # 将每个像素减去平均值,以中心化
covar = np.matmul(np.transpose(CenterImg), CenterImg)
evalues, evectors = linalg.eig(covar) # 求特征值及特征向量
principle_xis = evectors[:, np.argmax(evalues)] # 特征值最大的轴是主轴
principle_xis = principle_xis/np.sum(principle_xis) # 将主轴的元素和变为1
principle_xis = principle_xis[:, np.newaxis] # 将主轴转换成(3,1)
principle_img = np.matmul(imgArrT, principle_xis) # 投影到主轴
principle_img = np.uint8(principle_img.reshape((nrows, ncolumns))) # 还原为主轴灰度图
cv2.imshow("principle", principle_img)
grayimg = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow("Gray", grayimg)
cv2.waitKey(0)