pandas数据处理

pandas数据处理

1、删除重复元素

合并只处理列不处理行
重复元素只检测行,不检测列

使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每一个元素对应一行,如果该行不是第一次出现,则元素为True
在这里插入图片描述
df
在这里插入图片描述
duplicated()函数的参数:
subset=None, keep=‘first’
subset 指定列标签列表,列表内的标签是用于检测重复数据的字段
keep有两个参数一个是first 另一个是last
first 除第一个找到相同元素并显示为True
last除第最后一个找到相同元素并显示为True
作用:找相同元素

df.duplicated(keep='first')

在这里插入图片描述
可以使用drop_duplicates()函数删除重复的行
drop_duplicates()函数参数:
subset=None, keep=‘first’, inplace=False
subset:指定列去重

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值