主成分分析(Principal Component Analysis,PCA),主成分分析是一种 降维算法,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。一般来说,当研究的问题涉及到多变量且变量之间存在 很强的相关性时,我们可考虑使用主成分分析的方法来对数据进行 简化
一、目的
主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术
数据降维的优势
使得数据集更易使用;
降低算法的计算开销;
去除噪声;
使得结果容易理解。