15、主成分分析(PCA)全面解析:原理、应用与实践

主成分分析(PCA)全面解析:原理、应用与实践

1. PCA与奇异值分解(SVD)的关系

在数据分析中,PCA和SVD是两个重要的概念。奇异值分解(SVD)能将矩阵M分解为两个矩阵U和V,以及一个奇异值向量D,即 $M = UDV^T$。将上矩阵U与对角矩阵D(其对角值由奇异值向量D给出)相乘,能像用旋转矩阵乘以原始数据一样,将数据投影到新坐标上。例如,使用R语言的 svd 命令实现与 prcomp 命令相同的旋转操作:

svd.sample <- svd(matrix(c(x,y), ncol = 2))
manual.rotation <- svd.sample$u %*% -diag(svd.sample$d)
plot(manual.rotation[,1], manual.rotation[,2], xlim = c(0, 150), ylim = c(-75, 75))
2. 缩放与未缩放的PCA

数据缩放可能会产生很大影响。当数据集中的变量尺度不同时,协方差的特征值分解或原始数据的SVD可能会让人误以为数据在具有最大值的变量方向上对齐。例如,在葡萄酒数据集里:

red.wine <- read.csv('winequality-red.txt')
wine.eigen.cov <- eigen(cov(red.wine[,-12]))
wine.eigen.cor <- eigen(cor(red.wine[,-1
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值