在学习 《特征工程入门与实践》 第三章,填充缺失值时,出现问题了
# 2.填充缺失值
from sklearn.preprocessing import Imputer
imputer = Imputer(strategy='mean')
pima_imputed = imputer.fit_transform(pima)
type(pima_imputed) # Imputer的输出值不是pandas的Dataframe,而是Numpy数组

报错提示:ImportError: cannot import name ‘Imputer’ from ‘sklearn.preprocessing’。
先来查看一下sklearn的版本:
import sklearn
print("Sklearn verion is {}".format(sklearn.__version__))
输出:Sklearn verion is 0.22.1
这下很明显了,我的sklearn版本是0.22.1,因为0.22版本的sklearn,imputer不在preprocessing里了,而是在sklearn.impute里,除了SimpleImputer外,还增加了KNNImputer,另外还有IterativeImputer用法。
将导入的方式改成from sklearn.impute import SimpleImputer就好啦
from sklearn.impute import SimpleImputer
imputer = SimpleImputer(strategy='mean')
pima_imputed = imputer.fit_transform(pima)
type(pima_imputed) # Imputer的输出值不是pandas的Dataframe,而是Numpy数组
这样就能成功打印出pima_imputed的类型:numpy.ndarray

本文解决在使用sklearn进行特征工程时遇到的Imputer迁移问题,详细介绍了从旧版本到0.22版本后Imputer位置变化及正确使用方式。

被折叠的 条评论
为什么被折叠?



