【Pandas】坑点

数据分组group(分组前和分组后数据量对不上)

分组的数据,分组前总得数据量,应该等于分组后,每组len加起来的总和

chushi_len=len(df) #数据未分组前的长度
 index_value = list()
 for index, groupdf in df.groupby(by=group_list):
     index_value.append(len(groupdf))
zuihou_len=sum(index_value )  

chushi_len应该等于zuihou_len,但是最近我码代码遇到一个情况就是这两个值,不相等。经过调试发现,原来是进行分组的列含有nan
这是你只需要把这一列的nan值进行填充即可。
例如:

group_list = ['aa', 'bb', 'cc']#其中cc列中有nan值
df['cc']=df['cc'].fillna(你想填充的)

将特殊列进行处理之后,再分组,数据就对得上了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值