灵活使用unstack和nunique真的是相当的强大,遇到了统计套牌车的一个需求。
第一部我们使用分组函数统计车牌号,并将其展开成一个映射表,统计出现次数,使用unstack(0)是指将第几个列名抬上去,由双主键变为一列,一序号。
cartype = df.groupby(['车牌号', '车型'])['车型'].count().unstack(level=0)
unstack前
车牌号 车型
计货2 1 1 1 1 1 1
辽A837GK 计货1 1 1 1 1 1 1
冀C79185 计货2 1 1 1 1 1 1
unstack后
车牌号