机器学习-主成分分析PCA

目录

8.1主成分分析

        8.11主成分分析介绍

        8.12主成分分析PCA算法流程

        8.13PCA优缺点

8.2PCA算法实现

        8.22数据准备

        8.23算法实现

8.3实验结果分析与总结

        8.31实验结果分析

        8.32实验结果总结


8.1主成分分析

        8.11主成分分析介绍

       主成分分析PCA是一种广泛使用的数据降维技术,用于减少数据集的维数,同时尽可能保留数据的主要信息。它通过将数据投影到一个新的正交坐标系中,使得新的坐标系中的每个轴(主成分)都是原始数据集中最大方差方向的线性组合。PCA的应用包括数据压缩、特征提取、数据可视化等。

        8.12主成分分析PCA算法流程

        (1)对所有的样本进行中心化处理,满足均值为0的分布

        (2)计算样本的协方差矩阵XX^{T}

        (3)对矩阵XX^{T}进行特征值分解

        (4)取出最大的P个特征值对应的特征向量(w_{1},w_{2},w_{3},...,w_{p}),将所有的特征向量标准化后,组成特征向量矩阵(投影矩阵)W;

        (5)对样本集中的每一个样本x(i),转化为新的样本z(i) = W^{T}x(i);

        (6)得到输出样本集X = (z(1),z(2),z(3),...,z(m))。

        8.13PCA优缺点

优点:PCA能有效减少数据的维度,同时保留大部分变异性,有助于去除噪声;通过正交转换消除了数据的相关性

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值