PCA学习笔记

PCA的意义

机器学习中的主要问题:维度灾难 
PCA:在力求数据信息丢失最少的原则下,对高纬度的变量空间降维 ,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多的保留信息。这些综合指标就称为主成分 。

PCA推导

该X的协方差矩阵 为
在这里插入图片描述

由于此矩阵为非负定的对称阵,则有利用线性代数的知识可得,比存在正交矩阵U,使得 : 在这里插入图片描述

其中P个特征值,假设大小是降序。
而U恰好是由特征根相对应的特征向量所组成的正交阵

在这里插入图片描述
这里,由U的第一列元素所工程为原始变量的线性组合有最大的方差 。 (证明比较复杂,可自行研究)
在这里插入图片描述
有些时候,第一主成分不足,所以要寻找第二主成分.

第二主成分

在约束条件cov(F1,F2)=0下,寻找第二主成分F2=U12X1+…+Up2Xp

PCA 实施

在这里插入图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值