一文了解主成分分析

主成分分析(PCA)是一种非监督学习的降维技术,用于减少数据集的复杂性。它通过找到最大化方差的新的坐标系(主成分),来转换原始多维度数据,使得大部分信息集中在少数新变量上。PCA有助于简化数据分析,降低相关性,并减少回归和聚类中的变量数量。然而,PCA的缺点在于新主成分的解释性较弱,且可能丢失小贡献率主成分中的关键信息。

概要

本文章分为三部分
1:什么是主成分分析;
2:为什么做主成分分析;
3:步骤;
4:优缺点;

1:什么是主成分分析

主成分分析方法,是一种数据降维算法(非监督的机器学习方法)。

其最主要的用途在于“降维”,通过析取主成分显出的最大的个别差异(就是找出属性中相关性小的几个属性。),发现更便于人类理解的特征。也可以用来削减回归分析和聚类分析中变量的数目。

2:为什么做主成分分析

因为在数据分析时收集的属性都是多维度的变量。并且多变量之间可能存在相关性,从而增加了问题分析的复杂性。

所以我们需要减少需要分析的指标数量。并且如果对每个指标进行单独分析,其分析结果往往是孤立的,不能完全利用数据中的信息,因此如果盲目减少指标会损失很多有用的信息,从而产生错误的结论。

所以我们需要找到一种合理的方法,在减少需要分析的指标同时,尽量减少原指标包含信息的损失,以达到对所收集数据进行全面分析的目的。由于各变量之间存在一定的相关关系,因此可以考虑将关系紧密的变量变成尽可能少的新变量,使这些新变量是两两不相关的,那么就可以用较少的综合指标分别代表存在于各个变量中的各类信息。主成分分析就属于这类降维算法。

3:步骤

第一步:样本归0
将样本进行均值归0(demean),即所有样本减去样本的均值。样本的分布没有改变,只是将坐标轴进行了移动。
第二步:找到样本点映射后方差最大的单位向量ω

4:优缺点

优点:
1、以方差衡量信息的无监督学习,不受样本标签限制。
2、由于协方差矩阵对称,因此k个特征向量之间两两正交,也就是各主成分之间正交,正交就肯定线性不相关,可消除原始数据成分间的相互影响
3. 可减少指标选择的工作量
4.用少数指标代替多数指标,利用PCA降维是最常用的算法
5. 计算方法简单,易于在计算机上实现。
缺点:
1、主成分解释其含义往往具有一定的模糊性,不如原始样本完整
2、贡献率小的主成分往往可能含有对样本差异的重要信息,也就是可能对于区分样本的类别(标签)更有用

在结构光测量技术中,优化条纹中心提取的精度和效率是实现高精度表面形貌测量的关键。推荐参考《主成分分析法:高效精确的结构光条纹中心提取》一文,来深入了解相关技术和方法。 参考资源链接:[主成分分析法:高效精确的结构光条纹中心提取](https://wenku.youkuaiyun.com/doc/7xhzko66po) 首先,大津阈值法用于识别图像的感兴趣区域(ROI),以减少噪声干扰。随后,通过两次高斯卷积操作,我们可以获得条纹的梯度分布。此步骤是确定条纹中心初始位置的基础,并且对于提高定位精度至关重要。在获取初始位置后,主成分分析(PCA)被用来优化条纹上点的法线方向计算。PCA通过降维技术,突出数据的主要特征方向,简化模型,并提升计算速度。 接着,利用法线方向上的二阶泰勒展开技术,可以精确地求出条纹中心的位置。二阶泰勒展开是一种数值逼近方法,能够更准确地描述条纹灰度分布的变化,进而提高中心点的提取精度。 通过上述方法,相比传统Steger算法,本方法在保持高精度的同时,能显著提高处理速度。实验结果表明,本方法在精度上具有更低的均方误差(MSE),而在速度上提高了近3倍。这对于实时应用的结构光视觉检测系统来说,意味着更快速的处理和响应。 总之,将主成分分析和梯度分布法结合应用于结构光测量,不仅可以提高条纹中心提取的精度,还能显著提升处理速度,这对于实时应用而言是极大的技术优势。为了进一步深入了解该方法的技术细节和应用实践,建议查阅《主成分分析法:高效精确的结构光条纹中心提取》一文,该资源详细介绍了相关算法和实验验证,是深入学习的理想选择。 参考资源链接:[主成分分析法:高效精确的结构光条纹中心提取](https://wenku.youkuaiyun.com/doc/7xhzko66po)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值