pandas统计函数count,unique,nunique的区别

本文探讨了pandas库中count、unique和nunique三个统计函数的区别。count函数用于统计非空数值的个数,会过滤掉NaN但保留空字符串;unique返回去重后的所有元素,包括NaN和空字符串;nunique则是统计去重后的非空元素个数,同样忽略NaN但包含空字符串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

原始数据准备

import pandas as pd
df1=pd.DataFrame()
df2=pd.DataFrame()
df1['name']=['a','b','c','d','e','f','g']
df2['name']=['a','b','c','d','e','f']
df1['class']=['1','1','2','2','3','3','2']
df2['grade_state']=['1','1','1','','','3']
df3=df1.merge(df2,how='left')   #产生NaN空值

在这里插入图片描述

统计不同班级所有成绩等级的个数(使用count,nunique,unique不同结果如图)
在这里插入图片描述

结论:count是统计非空数值个数(过滤掉nan,但会统计空字符串’‘)
unique是返回去重后所有元素(包含nan以及空字符串’‘)
nunique是统计去重后元素的个数(过滤掉nan,但会统计空字符串’‘)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值