PCA降维

PCA降维是一种广泛应用的降维方法,通过投影到低维度子空间以保持数据特性。本文详细介绍了PCA的两种优化目标及其等价性,探讨了优化函数的求解过程,并解释了中心化的重要性。同时,解释了为何PCA降维时选择特征值较大的主成分以及如何保留数据能量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

PCA降维


  MDS降维在完全保持距离的情况下,推导式严谨的,而当需要损失一定维度的时候,直接去掉特征值小的维度就用到了主成分分析的方法。PCA降维是高等代数里面的一个技巧,属于各个领域应用比较多的一种降维方法。但是西瓜书上的推导过于粗略,很多线性代数或者矩阵求导的部分都直接给出了结果或者跳步,所以我自己详细推导了一下。


PCA降维优化目标的两种推出方式

  首先,我们推出PCA降维的思路是投影到一个低维度的子空间中,这一点和MDS降维的精确形式一致。那么,怎样的子空间是优秀的呢?有以下两种想法:
  1)最近重构性,投影离原来向量尽量接近。
  2)最大可分性,投影之间尽量分开。

  其实还有一种想法是如果本来有两类,投影开来区分度要大,也就是说两类内部尽量接近,差得尽量远,就是广义瑞利熵刻画的,这就是LDA,但是这里没有两类,所以这种想法不考虑。


PCA降维导出目标函数的推理

  西瓜书或者大部分教材对此推理的线性代数运算跳步很严重,很多并不显然的步骤被跳步了。比如以下几个技巧,把标量做转置,标量与向量换位,这些技巧如果不注意使用的话,很容易合并不了同类项无法进一步计算。
  经过推理可以看出,两种思路推出的目标函数或者优化的形式是一致的。

这里写图片描述


优化函数的求解和中心化

  目标函数的求解可以使用拉格朗日乘子法,矩阵求导的部分技巧还是很多的。如果不追求严格性的话,可以直接把

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值