机器学习算法之------PCA主成分分析(降维)

PCA主成分分析是一种有效的数据降维方法,常用于数据压缩和可视化。通过找到最大化投影误差最小化的向量,将高维数据投影到低维空间。PCA与线性回归的主要区别在于它寻找投影面而非预测关系。降维过程包括数据预处理、计算协方差矩阵、奇异值分解、选取特征向量和降维。主成分个数的选择通常基于投影误差和总变差。Python中可使用scikit-learn库进行PCA操作。

PCA主成分分析(降维)

  • 1、用处
  • 数据压缩(Data Compression),使程序运行更快
  • 可视化数据,例如3D–>2D等
  • 2、2D–>1D,nD–>kD
    如下图所示,所有数据点可以投影到一条直线,是投影距离的平方和(投影误差)最小

在这里插入图片描述
注意数据需要归一化处理
思路是找1个向量u,所有数据投影到上面使投影距离最小
那么nD–>kD就是找k个向量u(1),u(2)…u(k){u^{(1)}},{u^{(2)}} \ldots {u^{(k)}}u

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Adam婷

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值