目录
集中趋势
均值(加权截尾去尾几何调和)
np.mean(jd_stock['opening_price'])
# 加权算术平均数
np.average(jd_stock['opening_price'],weights=jd_stock['volume'])
jddf['opening_price'].mean()
# 截尾均值【去掉最大N个和最小的N个值之后的均值】
from scipy import stats
stats.tmean(jd_stock['opening_price'],(25,30))
# 缩尾均值
stats.matats.winsorize(jd_stock['opening_price'],(0.05,0.05)).mean()
#几何平均&调和平均
stats.gmean(jd_stock['opening_price'])
stats.hmean(jd_stock['opening_price'])
中位数
np.median(jd_stock['opening_price'])
jddf['opening_price'].median()
stats.nanmedian(jd_stock['opening_price'])
分位数
#计算指定分位点的分位数
stats.scoreatpercentile(jd_stock['opening_price'],[10,20,25,50,75,100])
#计算指定数值所处的分位点
stats.percentileofscore(jd_stock['opening_price'],30.27)
#也可以用stats.mstats.mquantiles计算
众数
stats.mode(jd_stock['opening_price'])
>返回众数和众数出

这篇博客探讨了Python中用于数据描述的关键概念,包括集中趋势的测量(如均值、中位数、分位数和众数)和离散程度的指标(如极差、四分位差、方差、标准差和变异系数)。此外,还介绍了分布形状的评估,如偏度和峰度,以及如何使用数据透视表进行数据分析。
最低0.47元/天 解锁文章
1万+

被折叠的 条评论
为什么被折叠?



