一、PCA
1.1 概述
主成分分析(PCA)是一种常用的数据降维方法,它通过线性变换将原始数据变换为一组各维度线性无关的表示,通常用于高维数据的处理和可视化。
1.2 特征维度约减
特征约减的目的是将高维特征向量映射到低维子空间中
给定n个样本(每个样本维度为p维)
通过特征变换/投影矩阵实现特征空间的压缩:
大多数机器学习算法在高维空间中表现不够鲁棒,查询速度与精度随着维度增加而降低.有价值的维度往往很少
1.3 协方差矩阵
在统计学中,方差是用来度量单个随机变量的离散程度,而协方差则一般用来刻画两个随机变量的相似程度
方差:
协方差:
例:如果观测N个人的体重w和身高h,这样会形成的样本空间,观测向量
表示第j个人体重和身高,观测矩阵可以表示为:

最低0.47元/天 解锁文章
1952

被折叠的 条评论
为什么被折叠?



