Pandas 描述统计函数

最新推荐文章于 2025-06-30 10:12:07 发布

Claroja

最新推荐文章于 2025-06-30 10:12:07 发布

阅读量9.4k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： pandas 文章标签：数据 python pandas

本文链接：https://blog.youkuaiyun.com/claroja/article/details/65445063

pandas 专栏收录该内容

82 篇文章

订阅专栏

本文介绍了Pandas库中用于统计描述的各种方法及其参数。包括count、sum、mean等基本统计量,以及mad、skew等高级统计量的计算方式。同时也解释了不同数据结构如Series、DataFrame和Panel在调用这些统计方法时轴参数的不同。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在进行统计描述时,pandas对三个数据对象的轴参数规定如下:
Series: 没有轴参数
DataFrame: “index” (axis=0, default), “columns” (axis=1)
Panel: “items” (axis=0), “major” (axis=1, default), “minor” (axis=2)
统计描述参数如下:

Function	Description	描述
count	Number of non-null observations	观测值的个数
sum	Sum of values	求和
mean	Mean of values	求平均值
mad	Mean absolute deviation	平均绝对方差
median	Arithmetic median of values	中位数
min	Minimum	最小值
max	Maximum	最大值
mode	Mode	众数
abs	Absolute Value	绝对值
prod	Product of values	乘积
std	Bessel-corrected sample standard deviation	标准差
var	Unbiased variance	方差
sem	Standard error of the mean	标准误
skew	Sample skewness (3rd moment)	偏度系数
kurt	Sample kurtosis (4th moment)	峰度
quantile	Sample quantile (value at %)	分位数
cumsum	Cumulative sum	累加
cumprod	Cumulative product	累乘
cummax	Cumulative maximum	累最大值
cummin	Cumulative minimum	累最小值
cov()	covariance	协方差
corr()	correlation	相关系数
rank()	rank by values	排名
pct_change()	time change	时间序列变化