主成分分析(principal component analysis, PCA)。
1、样本
1.1、样本数据集
导入一个二维的数据集并显示,得到。
>> load ('ex7data1.mat');
>> plot(X(:, 1), X(:, 2), 'bo');
>> axis([0.5 6.5 2 8]); axis square;
1.2、执行PCA算法
PCA算法包括如下几个部分:
对原始数据进行归一化:其归一化的算法为X:=(X-mu)/sigma,其中mu为数据的均值,sigma为数据的标准差。
计算数据的协方差矩阵:
对协方差矩阵进行奇异值分解:
若降为K维,则取Ureduce = U(:,1:K);
降维后的数据为Z = Ureduce’ * X 。
完善函数[U, S] = pca(X)有:
function [U, S] = pca(X)
[m, n] = size(X);
U = zeros(n)