机器学习特征处理常用方法
1 使用均值填充
#空值的处理
X = X.replace("?", np.NAN)
# 使用Imputer给定缺省值,默认的是以mean
# 对于缺省值,进行数据填充;默认是以列/特征的均值填充
imputer = Imputer(missing_values="NaN")
X = imputer.fit_transform(X,Y)
2 字符数据进行编码
from sklearn.p...
原创
2019-08-25 11:44:54 ·
866 阅读 ·
0 评论