DataFrame详解——计算/描述性统计

本文深入探讨了Pandas DataFrame在计算和描述性统计方面的应用,包括平均值、中位数、标准差等核心统计指标的计算方法,帮助读者掌握数据集的基本分析技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

计算/描述性统计

方法解释
DataFrame.abs()返回具有每个元素的绝对值的Series/DataFrame
DataFrame.all([axis, bool_only, skipna, level])返回是否所有元素都是True
DataFrame.any([axis, bool_only, skipna, level])返回是否有任何元素为True
DataFrame.clip([lower, upper, axis, inplace])使用指定上下阈值替代边界外的值,如:
df.clip(lower=-4, upper=6)将小于-4的值用-4替换,大于6的值用6替换
DataFrame.corr([method, min_periods])计算自身各列间的相关性,不包括NA/NULL值
DataFrame.corrwith(other[, axis, drop, method])计算两个DataFrame的各行或各列的相关性
DataFrame.count([axis, level, numeric_only])计算每个列或行的非空单元格
DataFrame.cov([min_periods, ddof])计算各列的协方差,不包括NA/NULL值
DataFrame.cummax([axis, skipna])在DataFrame或Series指定轴上返回累积最大值
DataFrame.cummin([axis, skipna])在DataFrame或Series指定轴上返回累积最小值
DataFrame.cumprod([axis, skipna])在DataFrame或Series指定轴上返回累积乘
DataFrame.cumsum([axis, skipna])在DataFrame或Series指定轴上返回累积和
DataFrame.describe([percentiles, include, …])生成描述性统计数据
DataFrame.diff([periods, axis])对数据进行一阶差分
DataFrame.eval(expr[, inplace])计算描述DataFrame列上操作的字符串,如:
df.eval('col1 + col2')返回第1列+第2列的结果
DataFrame.kurt([axis, skipna, level, …])在所要求的轴上返回无偏的峰度
DataFrame.kurtosis([axis, skipna, level, …])在所要求的轴上返回无偏的峰度
DataFrame.mad([axis, skipna, level])返回所请求轴上值的平均绝对偏差
DataFrame.max([axis, skipna, level, …])返回所请求轴上值的最大值
DataFrame.mean([axis, skipna, level, …])返回所请求轴上值的平均值
DataFrame.median([axis, skipna, level, …])返回所请求轴上值的中值
DataFrame.min([axis, skipna, level, …])返回所请求轴上值的最小值
DataFrame.mode([axis, numeric_only, dropna])返回所请求轴上值的众数
DataFrame.pct_change([periods, fill_method, …])当前元素和先前元素之间的百分比变化
DataFrame.prod([axis, skipna, level, …])在请求的轴上返回值的乘积
DataFrame.product([axis, skipna, level, …])在请求的轴上返回值的乘积
DataFrame.quantile([q, axis, numeric_only, …])在请求的轴上返回指定分位数值
DataFrame.rank([axis, method, numeric_only, …])沿轴计算数值数据排名(1到n)
DataFrame.round([decimals])将DataFrame所有十进制值四舍五入到指定小数位
DataFrame.sem([axis, skipna, level, ddof, …])返回平均超过要求的轴的无偏标准误差
DataFrame.skew([axis, skipna, level, …])在请求的轴上返回无偏偏差
DataFrame.sum([axis, skipna, level, …])返回请求轴上的值之和
DataFrame.std([axis, skipna, level, ddof, …])返回请求轴上的标准差
DataFrame.var([axis, skipna, level, ddof, …])返回请求轴上的无偏方差
DataFrame.nunique([axis, dropna])计算指定轴中不重复的元素数量
DataFrame.value_counts([subset, normalize, …])返回包含DataFrame中唯一行数的Series
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值