简介:
本讲将介绍主成分分析
(Principal Component Analysis,PCA)
,主成分分析是一种降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。一般来说,当研究的问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行简化。
数据降维的作用:

主成分分析的思想:
例题讲解与操作步骤

(注意:分析这一块尤为重要,需要自己理解)
例题二
(1)计算相关系数

(2)计算关键变量

(3)对主成分简要分析
Matlab代码详解(代码见:PCA.m)
主成分分析用于聚类
主成分聚类最大的意义就是能帮我们可视化最后的聚类效果,毕竟,使用主成分是会降低部分信息的。言外之意,只有在指标个数特别多,且指标之间存在很强的相关性时才用主成分聚类。
主成分分析用于回归
主成分回归可用来解决多重共线性的问题。
例题:
关于主成分回归的看法