机器学习（PCA）

最新推荐文章于 2025-06-03 20:27:29 发布

原创最新推荐文章于 2025-06-03 20:27:29 发布 · 1.8k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #机器学习

机器学习（PCA）

前言

PCA运用线性代数进行数据降维，属于无监督学习方法之一。其实现过程为通过寻找k个向量，将数据投影到这k个向量展开的线性子空间上，以最小化投影误差。

一、PAC与线性回归之间的关系

1、线性回归的目的是给定输入特征量x，预测出某变量y的值。因此在线性回归中会拟合一条直线，使得预测值与真实值之间的距离最小。PCA的目的是将数据投影到低维特征空间，使得投影误差最小。
2、线性回归中用所有的x值来预测一个特殊的变量y。而PCA中，所有特征向量 $x_{1},x_{2},...x_{n}$ 是等价的。

二、PCA算法

训练集：有m个样本，每个样本的特征维度为n $x^{(1)},x^{(2)},...x^{(m)}$

数据预处理（特征缩放/均值归一化）
1、计算每个特征的均值
2、每个特征减去其均值
3、如果不同的特征具有不同的尺度，如x1表示房子的大小，x2表示卧室的数量，对特征进行缩放，使其具有相同的范围

特征均值的计算公式为: $\mu_{j}=\frac{1}{m}\sum\limits_{i=1}^{m}x_{j}^{(i)}$

将n维数据降到k维：
1、计算协方差矩阵
2、求解特征值和单位特征向量e
3、按照特征值从大到小的顺序，排列单位特征向量，得到转换矩阵P，并依据PX计算出主成分矩阵
4、用特征值计算主成分的方差贡献率和累计方差贡献率，选择k个主成分

降维之主成分分析法

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qingxiaozi2333

关注关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

机器学习之PCA

m0_74043999的博客

06-12

1271

PCA（Principal Component Analysis）是一种常见的数据分析方法，是一种使用最广泛的数据降维算法（非监督的机器学习方法）。它通过线性变化将原始数据变换为一组各维度线性无关的表示，可用于提取数据的主要特征分量，常用语高维数据的降维。通俗地说，就是将高维度数据变为低纬度。例如我们通过电视看体育比赛，在电视的纯平显示器上有一个球，显示器大概包含一百万像素，而球则是由比较少的像素组成，因此我们实时将显示器上的百万像素转换成一个三维图像，也就让我们看到了运动场上球的位置，这个过程就是降维。

机器学习--主成分分析(PCA)

m0_73531849的博客

06-18

1414

PCA 是（Principal Component Analysis ）的缩写，中文称为主成分分析法。它是一种维数约减（Dimensionality Reduction）算法，即把高维度数据在损失最小的情况下转换为低维度数据的算法。显然，PCA 可以用来对数据进行压缩，可以在可控的失真范围内提高运算速度，提高机器学习的效率，使较为复杂的数据简单化。所谓损失最小就是从高维向低维映射的时候误差最小，低维空间的描述是向量组，k维空间就用k个向量来描述这个空间。

参与评论您还未登录，请先登录后发表或查看评论

机器学习——PCA

wsndddhh的博客

06-18

7887

PCA（Principal Component Analysis，主成分分析）是一种常用的数据降维技术，它可以将高维数据转换为低维数据，同时保留数据的关键特征。在机器学习和数据分析中，PCA 可以帮助减少特征的数量，降低计算成本，去除噪声并防止过拟合。

机器学习——PCA降维（我至今为止遇见的最好的博文）

热门推荐

邹小驴

09-07

5万+

参考文章：https://zhuanlan.zhihu.com/p/77151308 PCA（Principal Component Analysis）是一种常见的数据分析方式，常用于高维数据的降维，可用于提取数据的主要特征分量。 PCA 的数学推导可以从最大可分型和最大重构性两方面进行，前者的优化条件为划分后方差最大，后者的优化条件为点到划分平面距离最小。由于基于最大重构性的 PCA 其与...

机器学习PCA降维实战项目

02-11

在这个"机器学习PCA降维实战项目"中，我们将深入探讨PCA的基本原理、实现步骤以及其在实际数据集上的应用。首先，PCA的核心思想是找到原始数据集的主要成分，这些主要成分能最大化数据的方差，同时尽可能保持数据...

pca.py机器学习pca降维

05-23

Python机器学习，pca

机器学习报告-基于PCA和KNN算法的毒蘑菇分类预测实验报告-机器学习高分大作业

11-18

实验采用了UCI机器学习库中的mushroom数据集，该数据集包含8124个样本，每个样本有22个特征，分为毒蘑菇和可食用蘑菇两类。PCA用于降低多维度特征，KNN则作为分类算法，由于其简单、精度高和对异常值不敏感的特性，...

机器学习PCA与线性回归结合的特征降维及模型优化：数据标准化、超参数调优与模型评估系统设计

04-10

适用人群：具备一定机器学习基础，对PCA和线性回归有一定了解的研发人员或数据科学家。使用场景及目标：①通过PCA实现数据降维，减少特征维度，提高模型训练效率；②利用线性回归建立特征与目标变量之间的线性关系...

机器学习—PCA

赵亮的优快云博客

11-16

524

文章目录PCA 本文将记录有关PCA降维的内容。当样本维度过高但是数据集数量较小时，在训练模型时很容易陷入过拟合，处理过拟合可以采用正则化、增加数据量、降低数据维度。在降低数据维度可以采用的方法有特征选择、线性降维（PCA）、非线性降维（流形） PCA 数据集 X=(x1,x2,..,xN)TX=(111)X=(x_1,x_2,..,x_N)^T\\ X= \left( \begin{array...

机器学习——主成分分析（PCA）

2301_80841566的博客

06-03

3569

成功地将高维数据投影到二维空间，并通过可视化展示了数据的分布情况通过PCA重建的图像在保留主要特征的同时实现了数据压缩较高的解释方差比表明选择的主成分能够有效地捕捉数据的主要变化这些结果表明PCA是一种有效的降维和特征提取方法，可以用于图像处理和模式识别等领域。然而，需要注意的是，尽管PCA能够保留数据的主要特征，但在某些情况下可能会丢失一些细节信息，因此在实际应用中需要根据具体需求权衡降维的效果和信息损失Xx_%7Bi%7Du_%7Bi%7Dx_%7Bi%7DX%5Csumn%5Csumd。

机器学习-PCA

A8186的博客

02-10

652

PCA（Principal Component Analysis）是一种常用的数据降维方法，它的主要思想是将高维数据降维到一个低维空间，同时保留尽可能多的原始数据的信息。PCA (Principal Component Analysis) 是一种常用的数据降维算法，用于对高维数据进行降维和特征提取。它的主要思想是通过对数据的协方差矩阵进行特征值分解，选择前 k 个特征值最大的特征向量作为新的主成分，将原始数据投影到主成分空间，从而实现数据降维。

机器学习之PCA(1)

djj810625的博客

11-08

360

• 连续潜变量模型 • 经常有一些数据的未知的潜在的原因。 • 到目前为止,我们已经看了模型与离散的潜变量,如混合高斯模型的。 • 有时,依照我们观察到的数据是由连续因素控制的去思考更合适。 • 动机:对于许多数据集,数据点处于接近比原来的数据空间维数低得多的复本（manifold）。 • 训练连续潜变量模型通常被称为降维,因为通常有许多更少的潜在维度。 • 例子:主成分分析...

机器学习————PCA

m0_73044708的博客

06-19

915

ORL人脸库：由英国剑桥大学AT&T实验室创建，包含40个不同个体，每个个体包含10张不同姿态的人脸图像，共400张面部图像，部分人脸图像包括了姿态,表情和面部饰物的变化，其深度旋转和平面旋转可达20度；ORL人脸数据库中每个采集对象的10幅样本图片都经过归一化处理的灰度图像，图像尺寸均为92×112，图像背景为黑色。降低维度：PCA可以减少数据的维度，减少数据量，简化模型或可视化。去除噪声：PCA可以去除数据中的噪声和冗余信息，提高数据质量。

机器学习pca