此内容在sklearn官网地址: http://scikit-learn.org/stable/modules/preprocessing.html#
sklearn版本:0.18.2
缺失值不能直接删除。缺失值有其存在原因,删除后不仅使可用的数据变少,也会使原本的数据发生改变,影响结果准确性。
from sklearn.preprocessing import Imputer
im = Imputer() # 默认参数 missing_values="NaN",strategy="mean"
# strategy还可用"median"、"most_frequent"
im.fit(X)
im.