在sklearn中特征选择函数SelectKBest
from sklearn.feature_selection import SelectKBest
调用方式
#skb = SelectKBest(chi2, k=3) ## 只考虑3个维度
#X1_train = skb.fit_transform(X1_train, Y1_train) ## 训练模型及特征选择
参数
1、score_func : callable,函数取两个数组X和y,返回一对数组(scores, pvalues)或一个分数的数组。默认函数为f_classif,默认函数只适用于分类函数。
2、k:int or “all”, optional, default=10。所选择的topK个特征。“all”选项则绕过选择,用于参数搜索。
属性
1、scores_ : array-like, shape=(n_features,),特征的得分
2、pvalues_ : array-like, shape=(n_features,),特征得分的p_value值,如果score_func只返回分数,则返回None。
可选的score_function包括 f_classif,chi2,f_regression, 等

方法
1、fit(X,y),在(X,y)上运行记分函数并得到适当的特征。
2、fit_transform(X[, y]),拟合数据,然后转换数据。
3、get_params([deep]),获得此估计器的参数。
4、get_support([indices]),获取所选特征的掩码或整数索引。
5、inverse_transform(X),反向变换操作。
6、set_params(**params),设置估计器的参数。
7、transform(X),将X还原为所选特征。

应用:



本文详细介绍了sklearn库中的SelectKBest函数,该函数用于特征选择。通过设置score_func参数,可以选择适用于分类或回归任务的特征。例如,使用chi2进行分类任务,设置k值为3,仅保留最重要的3个特征。fit_transform方法同时完成拟合和特征选择。此外,还介绍了SelectKBest的属性、方法,如scores_、pvalues_、fit、transform等,帮助理解特征选择的过程。
5098

被折叠的 条评论
为什么被折叠?



