数据清洗常用函数——drop fillna
1
dropna 清理无效数据,默认how=any,axis=0 将含有Nan的行删除

how可选=any all
axis=0删除行 =1 删除列
thresh参数=3 说明这一行有>=3个Nan时改行才会被删
2.
drop按照条件删除行/列
删除某行/列 按照索引
删除某列:

删除某行:

条件删除:如果A列中含有的元素小于2或者大于80,则删除此行
data3=df.drop(df[(df[‘A’]<2)|(df[‘A’]>80)].index)
执行前:

执行后:

A列中大于80的行被删去
2.fillna函数 填充空值
array.fillna(10) 数值填充
不同列不同数值填充:


用该列的前一个/后一个非NaN的值填充NaN
ffill与bfill
data3=df.fillna(method=‘bfill’)

同下一列的数一样
本文介绍了数据清洗过程中两个关键函数的使用:dropfillna和条件删除。dropfillna默认删除包含Nan的行,可通过how和axis参数调整策略。条件删除允许根据特定条件(如A列值小于2或大于80)筛选并删除行。此外,fillna函数用于填充缺失值,可以使用数值、前一个非NaN值或后一个非NaN值进行填充。这些操作对于数据预处理和确保分析准确性至关重要。
2661

被折叠的 条评论
为什么被折叠?



