filter过滤式特征选择

该博客介绍了如何利用Python的sklearn库中的VarianceThreshold类进行特征选择。通过设置阈值为0,将所有方差为0的特征过滤掉,以简化数据集。示例展示了如何应用这个方法到一个简单的二维数据集上,经过处理后的数据集去除了方差为0的特征。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

from sklearn.feature_selection import VarianceThreshold 
X = [[0, 2, 0, 3], [0, 1, 4, 3], [0, 1, 1, 3]]
selector = VarianceThreshold(threshold = 0) #设定方差阈值=0,默认是移除所有组中含有相同元素的值
x_var0 = selector.fit_transform(X) 
x_var0
array([[2, 0],
       [1, 4],
       [1, 1]])
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值