DataFrame数据清洗

文章介绍了在Pandas的DataFrame中如何检查和处理缺失值,包括使用`df.info()`查看,`df.isnull()`和`df.notnull()`判断,`df.dropna()`删除,以及`fillna()`填充。同时,文章也涉及到了重复值的检测与去除,利用`df.duplicated()`判断和`df.drop_duplicates()`函数处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

暂时没有空进行直接演示,所有没有图片,只是看着教程,总结一些知识点,后面会实操,并把图片给补上,可视化非常重要!!!

DataFrame里面的缺失值使用NaN表示

查看缺失值

        使用df.info()方法能够实现每一列数据总数,如果与其他列数的总数不一致,就是该列出现了缺失值

判断是否存在缺失值

        df.isull()方法和df.notnull()方法,展示True或者False,这个更直观

删除缺失值

        df.dropna()方法可以删除存在缺失值的一整行数据,无论哪一列出现缺失值,都会把整行数据给删除

提取某一列数据不存在缺失值的数据

        df[df[‘列名’].notnull()]

缺失值填充

        df.['列名'] = df.['列名'].fillna('填充的内容')

判断是否有重复值

        df.duplicated()

去除重复的数据

        df.drop_duplicates(keep='last),keep参数的作用是保留哪一个重复值,默认是保留第一个,去除其他的重复值,如果keep=“last'就是保留最后一个,去除其他的重复值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值