import pandas as pda import numpy as np #数据预处理 data=pda.read_csv("titanic_train.csv") print(data.columns) #缺失值 # print(data[pda.isnull(data["Age"])]) # #非缺失值 # print(data[pda.notnull(data["Age"])]) # 缺失值比例 print(len(data["Age"][pda.isnull(data["Age"])])/len(data)) # 不缺失值比例 print(len(data[

本文介绍了Python使用pandas库进行数据预处理的方法,包括检查缺失值、计算缺失值比例、计算不缺失值比例、计算平均值以及使用透视表进行统计分析。此外,还展示了如何按条件删除含有缺失值的行。
最低0.47元/天 解锁文章
1721

被折叠的 条评论
为什么被折叠?



