缺失值的常用处理方式:
1.对包含缺失值的列和行数据进行删除
df.dropna()
2.对缺失值数据进行所在列的中位数、众数、平均值等进行填充
#对所有列的缺失值数据进行平均值填充
df.fillna(df.mean())
#对指定列的缺失值进行平均值填充
df.fillna(df["指定列索引"].mean())
3.对缺失值周围的数据进行模型训练,然后通过模型对缺失值进行填充
本文介绍处理数据缺失值的三种常见方法:删除含缺失值的行或列、使用中位数、众数或平均值填充,以及利用周围数据训练模型预测缺失值。适合初学者和数据分析师快速掌握缺失值处理技能。
缺失值的常用处理方式:
1.对包含缺失值的列和行数据进行删除
df.dropna()
2.对缺失值数据进行所在列的中位数、众数、平均值等进行填充
#对所有列的缺失值数据进行平均值填充
df.fillna(df.mean())
#对指定列的缺失值进行平均值填充
df.fillna(df["指定列索引"].mean())
3.对缺失值周围的数据进行模型训练,然后通过模型对缺失值进行填充

被折叠的 条评论
为什么被折叠?