在数据分析中的数据处理过程中,经常需要对数据进行分组计数,看下下面这组数据

数据中name 为C 的有三行,其中有2个code是重复的
目标:按name 分组,统计每组中code的不重复数量
df.groupby('name')['code'].nunique()
# 以name 分组后,统计code的不重复数目
结果如下:

排序
df.groupby('name')['code'].nunique().sort_values(ascending=False)
# 以name 分组后,统计code的不重复数目
本文介绍了在数据分析中如何使用Python的pandas库对数据进行分组并统计每组中特定字段的不重复数量,通过具体示例展示了groupby和nunique函数的用法。
1321

被折叠的 条评论
为什么被折叠?



