import pandas as pd
df = pd.read_csv(r’E:\py-code\test1\MachineLearning\datas\titanic.csv’)
① 显示每个列有缺失值的比例
缺失数量/总数量
m = df.shape[0]
print(df.isnull().sum() / m)
② 将age字段使用众数做缺失值填充
print(df[‘Age’].mode())
df[‘Age’] = df[[‘Age’]].fillna(24)
print(df[‘Age’])
③ 将其他有缺失数据删除
df.dropna(inplace=True)
④ 将处理后的数据保存为1.csv
df.to_csv(‘1.csv’)
该博客介绍了如何处理数据集中缺失值的方法。首先,通过计算每列缺失值占总数量的比例来了解缺失情况。接着,使用众数填充'Age'字段的空缺。然后,删除其他含有缺失值的行。最后,将处理后的数据保存为1.csv文件。
244

被折叠的 条评论
为什么被折叠?



