此内容在sklearn官网地址: http://scikit-learn.org/stable/modules/feature_selection.html
sklearn版本:0.18.2
特征选择除了上节说到的L1-based feature selection、Tree-based feature selection的主要方式。另外还有一些不那么常用方法,如官网中提到的Removing features with low variance、Univariate feature selection。
Removing features with low variance
以下为官网关于此内容的全部解释
设置方差阈值,根据阈值进行筛选。
Univariate feature selection
Univariate feature selection works by selecting the best features based on

本文介绍了Sklearn库中的两种特征选择方法:低方差移除和单变量特征选择。低方差移除通过设定方差阈值来剔除变化小的特征;单变量特征选择则利用统计测试选择最高得分的特征,提供了SelectKBest和SelectPercentile工具,分别依据评分和比例进行特征筛选。适用的评分函数包括f_regression、mutual_info_regression(回归问题)和chi2、f_classif、mutual_info_classif(分类问题)。
最低0.47元/天 解锁文章
3186

被折叠的 条评论
为什么被折叠?



