pandas数据处理

最新推荐文章于 2024-09-11 11:00:10 发布

my_白白白

最新推荐文章于 2024-09-11 11:00:10 发布

阅读量356

点赞数

分类专栏： juyter notebook IPython 文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_41170489/article/details/103911833

版权

IPython 同时被 2 个专栏收录

30 篇文章

订阅专栏

juyter notebook

19 篇文章

订阅专栏

pandas数据处理

1、删除重复元素

合并只处理列不处理行
重复元素只检测行，不检测列

使用duplicated()函数检测重复的行，返回元素为布尔类型的Series对象，每一个元素对应一行，如果该行不是第一次出现，则元素为True
在这里插入图片描述
df

duplicated（）函数的参数：
subset=None, keep=‘first’
subset 指定列标签列表，列表内的标签是用于检测重复数据的字段
keep有两个参数一个是first 另一个是last
first 除第一个找到相同元素并显示为True
last除第最后一个找到相同元素并显示为True
作用：找相同元素

df.duplicated(keep='first')

在这里插入图片描述
可以使用drop_duplicates()函数删除重复的行
drop_duplicates()函数参数：
subset=None, keep=‘first’, inplace=False
subset：指定列去重

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。