PCA主成因分析法

PCA(主成分分析)用于高维数据的降维,通过找到数据的主要特征来简化表示。其关键步骤包括特征中心化、计算协方差矩阵、选择最大特征值对应的特征向量。PCA旨在保留原始数据的大部分信息,同时减少冗余的线性相关维度,降低处理复杂性。两种解释分别是最大化投影方差和最小化重构误差。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

PCA算法的最终目标是把高维数据进行降维。之所以要降维,是因为数据在低维空间中处理起来更简单。可以用一个最简单的例子来说明降维,在三维空间中有一个球,我们可能希望研究一下球的几何性质,这个时候希望把它画在纸上(二维平面),那么怎么把它投影(project)到二维平面上就是一个降维的过程。这里的关键在于你投到二维平面上时,要看起来仍然要和原来在三维空间中的那个球达到最大相似,你不能把一个球经过降维之后变成了一个圆。而这正是PCA要干的事情,识别出原空间中最重要的多个特征(最重要的特征才能做到最相似)。这算是刚开始以一种最直观的方式看PCA。

假设针对一个物体进行建模,拥有了m维的数据,但其中有两维的数据是线性相关的,即知道其中一个数据,就能推测出另一个数据。我们要做的就是找出这种线性相关的数据,并把它剔除掉,同时尽可能的保证原有的数据信息。

PCA过程:

输入10组2维的数据,将其简化为k维的数据。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值