pandas基本数据统计分析

本文源于中国大学MOOC的'Python数据分析与可视化'课程,重点介绍了pandas库中的数据统计分析函数,包括适用于Series和DataFrame的方法。.describe()方法在Series和DataFrame上的应用,能生成包含多种统计信息的Series,并且在DataFrame上会按列计算统计值。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文的主要内容是基于中国大学mooc(慕课)中的“Python数据分析与可视化”课程进行整理和总结。
pandas提供了一些数据统计分析的函数,这些函数使用于Series和DataFrame类型。

函数名 函数定义
.sum() 计算数据的总和,按照0轴计算,下同
.count() 非NaN的数量
.mean() .median() 计算数据的算术平均值,算数中位数
.var() .std() 计算数据的方差,标准差
.min() .max() 计算数据的最小值/最大值

还有一些函数只适用于Serise类型。

函数名 函数定义
.argmin() argmax() 计算数据最小值,最大值所在位置的索引(自动索引)
.idxmin() idmax() 计算数据最小值,最大值所在位置的索引(自定义索引)

自动索引的一个比较大的好处在于:自动索引是一个0-n的数,我们很容易的可以通过区间切片或者索引的方式获得我们需要的数据,而自定义索引很难形成一个序列,对其进行切片相对复杂或没有一定规律可循。
在Series和DataFrame类型中有一个方法囊括了所有方法的结果:

函数名 函数定义
.describe() 针对0轴(各列)的汇总统计
a = pd.Series([9, 8, 7, 6],index=['a','b','c','d']
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值