主成分分析法

主成分分析法(PCA)是一种寻找数据接近n-1维子空间的方法,通过计算特征向量来降低数据的冗余。PCA在已标准化的数据上找到最大化方差的投影方向,选择使∑最大化下式的主特征向量,用于数据降维和去除相关性。在K维子空间中,PCA通过计算特征向量来表示数据,简化数据表示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

主成分分析法(PCA)

在本篇博客中,我们将会介绍一种方法,叫做主成分分析法(PCA),这种方法试图确定数据接近位于的子空间。PCA相对于因子分析法将会更为直接,它仅仅需要进行特征向量的计算(在Matlab中使用eig函数),并不需要使用EM算法。
假设我们有这样的一个数据集{ x(i);i=1,...,m}表示m个不同种类的汽车发动机的属性,例如他们的最大速度,选旋转半径等等。使得对于每个i 满足x(i)R(nm)。但是对于我们不知道的是——对于两个不同的属性,例如xixj——分别代表车的最大速度由英里/小时和千米/小时测量的结果。这两个属性几乎是线性相关的,仅仅是由于mph和kph之间凑整导致的误差。因此,因此这个数据实际上是位于一个接近n-1维的子空间。那么,我们如何自动检测,或者是移除这个冗余呢?
考虑一个更加自然的例子,这些数据是通过调查无线操控直升飞机的飞行员得到的,其中x(i)1代表飞行员i的驾驶技能,而x(i)2代表他们对飞行的喜欢程度。由于RC直升飞机非常难操控,只有正真喜欢它的学生才能成为好的飞行员。所以两个属性x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值