数据挖掘算法学习(四)PCA算法

主成分分析(PCA)是一种有效的数据处理和特征降维方法。适用于高斯分布或指数型分布的数据,通过计算样本均值和协方差矩阵来提取关键特征。广泛应用于人脸识别、图像压缩等领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转载请附上链接http://blog.youkuaiyun.com/iemyxie/article/details/38236647

算法简单介绍

主成分分析(PrincipalComponentAnalysis,简称PCA)一种经常使用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法

主要用于对特征进行降维。

算法如果

数据的概率分布满足高斯分布或是指数型的概率分布。

方差高的向量视为主元。

算法输入

包括n条记录的数据集

算法输出

降维或压缩后的数据集

算法思想

1. 计算全部样本的均值 m 协方差 矩阵 S
2. 计算 S 的特征值 大到小排序;
3. 选择前 n' 个特征值相应的特征矢量作成一个变换矩阵 E=[e1,e2, …, en’]
4. 最后。对于之前每个 n 维的特征矢量 x 能够转换为 n’ 维的新特征 矢量

    y=transpose(E)(x-m)

weka执行结果

以weather.nominal.arff为例执行结果部分截图例如以下:

算法应用

人脸识别

图像压缩

信号去噪

转载请附上链接 http://blog.youkuaiyun.com/iemyxie/article/details/38236647
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值