主成份分析图解

本文通过生成服从特定正态分布的数据集并进行旋转,演示了如何使用主成分分析(PCA)来提取数据的主要方向。首先构建了一个旋转矩阵,并利用该矩阵对数据进行了45度旋转。接着,通过求解协方差矩阵的特征值和特征向量,找到了数据的主成分方向,并再次对数据进行旋转,展示了PCA在数据降维和可视化中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

随机生成原始数据分布,共计300个点,服从正态分布。为了便于区分X方向和Y方向。使X方向服从均值为50,标准差为50的正态分布,Y方向服从均值为0,标准差为100的正态分布。
这里写图片描述
手动旋转θ=45度。先构建旋转矩阵rot,可以在wiki中找到rot矩阵的定义

rot=[cos(θ),sin(θ);sin(θ),cos(θ)]

然后执行选择操作,X=rotX,得到旋转45度后的分布
这里写图片描述
到了求主成份的时候了。先求协方差矩阵c=XXT。然后分解协方差矩阵,求得特征值d和特征向量e,这一步可以借用matlab的eig函数求解。特征向量e就是两个主成份方向,我们用rotX=eX得到X旋转后主成份正交(???)时的分布形态。看,又旋转回来了。只不过X方向正负对调了。
这里写图片描述

启发:

1.主成份的特征向量可以起到旋转的作用;
2.在二维平面中,旋转矩阵其实就是新定义的两个特征向量的方向,不用死记,画个图就记住了。

怎样理解下图呢?先求X方向的变化,就把下面的矩形框中cosθsinθ填到旋转矩阵的第一列中,然后把右边的矩形框中的sinθcosθ先到第二列中。

rot=[cos(θ),sin(θ);        sin(θ),cos(θ)]

先记录X方向,再记录Y方向,所以填入矩阵的顺序是
cos(θ),sin(θ),sin(θ),cos(θ)

这里写图片描述
这个图是偏理解,理解这个图之后,就记住旋转向量了,同时也就知道的特征向量的作用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值