pandas模块的统计指标--实现众数和众数的频数

本文介绍了如何利用pandas的统计方法describe()来计算数据的众数及其频数。对于数值型数据,describe()提供8种统计指标;对于非数值型数据,返回4种指标。要统计数值型数据的众数频率,需要先将其转换为类别型数据,再应用describe()函数。

1.numpy统计函数

max()最大值
min()最小值
ptp()极差
mean()平均值
var()方差
std()标准差
mode()众数        (返回一个dataframe格式的数据)
count()非空数目
median()中位数
cov()协方差

2.pandas统计方法describe()  

(1)数值型数据  返回8种指标

count   mean  std  min  25%  50%  75%  max

import pandas as pd
detail=pd.read_excel('./meal_order_detail.xlsx',sep=',',encoding='gbk')
print('amounts的describe统计指标:',detail['amounts'].describe())

(2)非数值型数据  返回四种指标

count  unique  top  freq

print(detail.dtypes)
# 选择dishes_name  类型为object
# 众数
print('dishes_name的众数:', detail['dishes_name'].mode())
print('dishes_name的非空数目:', detail['dishes_name'].count())
# 使用describe()进行非数值型数据统计分析
print('dishes_name的describe统计指标:', detail['dishes_name'].describe())  # 返回4种指标

(3)统计数值型数据的众数出现的频数

先将数值型数据转换成类别型数据,然后用describe()进行统计

类型转换用astype()实现

detail['amounts'] = detail['amounts'].astype('category')
# 再进行describe()统计分析
print(detail['amounts'].describe())

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值