ML特征工程中通过主成分分析对数据集进行降维压缩精准特征分类

本文介绍了如何使用主成分分析(PCA)进行数据降维,包括sklearn库的PCA函数用法,以及降维过程中的参数设置。一般步骤包括获取数据、合并相关特征、分析相关性并最终通过PCA保留大部分信息后降低维度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.主成分分析PCA降维  

接口:sklearn.decomposition.PCA(n_components  = None)  

传参:n_components 传参为小数时 表示保留百分之几的信息;

传参为整数时表示减少到多少维度的数据集

PCA降维最理想的效果是:即极大程度上的降低了数据集的维度,又保留了最多的数据集的message

code:

transfer = PCA(n_component = 2)
# 将数据集中的特征值降低为2维的数据
transfer = PCA(n_component = 0.95)
# 将数据集中的数据进行降维效果的处理,并保留百分之95的数据信息
datanow = transfer.fit_transform(data)
# data:需要进行降维的数据, datanow = 降维后的数据集

一般的流程:

1.get data_set

2.合并表(判断相关性的特征)

3.找到相关性之间的关系

4.PCA降维

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值