pandas模块的统计指标--实现众数和众数的频数

最新推荐文章于 2024-03-04 15:06:36 发布

原创最新推荐文章于 2024-03-04 15:06:36 发布 · 9.4k 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#pandas统计指标

数据分析同时被 2 个专栏收录

27 篇文章

订阅专栏

pandas

5 篇文章

订阅专栏

本文介绍了如何利用pandas的统计方法describe()来计算数据的众数及其频数。对于数值型数据，describe()提供8种统计指标；对于非数值型数据，返回4种指标。要统计数值型数据的众数频率，需要先将其转换为类别型数据，再应用describe()函数。

1.numpy统计函数

max()	最大值
min()	最小值
ptp()	极差
mean()	平均值
var()	方差
std()	标准差
mode()	众数（返回一个dataframe格式的数据）
count()	非空数目
median()	中位数
cov()	协方差

2.pandas统计方法describe()

（1）数值型数据返回8种指标

count mean std min 25% 50% 75% max

import pandas as pd
detail=pd.read_excel('./meal_order_detail.xlsx',sep=',',encoding='gbk')
print('amounts的describe统计指标：',detail['amounts'].describe())

（2）非数值型数据返回四种指标

count unique top freq

print(detail.dtypes)
# 选择dishes_name  类型为object
# 众数
print('dishes_name的众数：', detail['dishes_name'].mode())
print('dishes_name的非空数目：', detail['dishes_name'].count())
# 使用describe()进行非数值型数据统计分析
print('dishes_name的describe统计指标：', detail['dishes_name'].describe())  # 返回4种指标

（3）统计数值型数据的众数出现的频数

先将数值型数据转换成类别型数据，然后用describe()进行统计

类型转换用astype()实现

detail['amounts'] = detail['amounts'].astype('category')
# 再进行describe()统计分析
print(detail['amounts'].describe())