在处理实际问题中,多个变量之间可能存在一定的相关性,当变量的个数较多且变量之间存在复杂的关系时,增加了问题分析的难度。主成分分析是一种数学降维的方法,该方法主要将原来众多具有一定相关性的变量,重新组合成为一种新的相互无关的综合变量
那么,哪些是主成分?哪些是次要成分?如何界定主要成分和次要成分?
matlab求解
1. 数据标准化处理 函数:zscore(对每一列进行标准化处理)
2. 计算协方差矩阵(相关系数矩阵) 函数:corrcoef
3. 求出协方差矩阵的特征值及对应的特征向量
4. [x,y,z] = pcacov(r) r为协方差矩阵,x为主成分系数,y为特征值,z为各个主成分的贡献率
5. 计算主成分得分,原始数据矩阵*主成分系数(也是降维后的数据)
6. 根据降维后的数据,乘以各个主成分的贡献率(大家可以想象为权重,贡献率越大,权重越高),最终的综合得分就是综合评价