value_counts一般适用于单个series的频数统计,如果多个列具有相同的值的时候,比如调查问卷,需要根据答案的内容进行频数统计。这是如果每一列进行统计则效率较低,apply方法可以讲value_counts应用于dataframe的多个列,非常的方便。
df1.apply(pd.value_counts).T
需要进行百分比显示的时候请使用如下方法:
df.apply(lambda x: pd.value_counts(x, normalize=True))
博客介绍了在数据分析中,当多个列有相同值需按答案内容进行频数统计时,用apply方法将value_counts应用于DataFrame多列更高效,给出了相应代码。还提及需要百分比显示时的处理方法。
value_counts一般适用于单个series的频数统计,如果多个列具有相同的值的时候,比如调查问卷,需要根据答案的内容进行频数统计。这是如果每一列进行统计则效率较低,apply方法可以讲value_counts应用于dataframe的多个列,非常的方便。
df1.apply(pd.value_counts).T
需要进行百分比显示的时候请使用如下方法:
df.apply(lambda x: pd.value_counts(x, normalize=True))
1888
8836
1721

被折叠的 条评论
为什么被折叠?