中位数和平均值

区别联系

1)平均数是通过计算得到的,因此它会因每一个数据的变化而变化。

2)中位数是通过排序得到的,它不受最大、最小两个极端数值的影响。部分数据的变动对中位数没有影响,当一组数据中的个别数据变动较大时,常用它来描述这组数据的集中趋势。

3)众数也是数据的一种代表数,反映了一组数据的集中程度.日常生活中诸如“最佳”、“最受欢迎”、“最满意”等,都与众数有关系,它反映了一种最普遍的倾向。

优缺点:

平均数:需要全组所有数据来计算;易受数据中极端数值的影响。中位数:仅需把数据按顺序排列后即可确定;不易受数据中极端数值的影响。众数:通过计数得到;不易受数据中极端数值的影响。

对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。

中位数:也就是选取中间的数,是一种衡量集中趋势的方法。

例1

找出这组数据:23、29、20、32、23、21、33、25 的中位数。

解:

首先将该组数据进行排列(这里按从小到大的顺序),得到:

20、21、23、23、25、29、32、33

因为该组数据一共由8个数据组成,即n为偶数,故按中位数的计算方法,得到中位数

  

,即第四个数和第五个数的平均数。

例2

找出这组数据:10、20、 20、 20、 30的中位数。

解:

首先将该组数据进行排列(这里按从小到大的顺序),得到:

10、 20、 20、 20、 30

因为该组数据一共由5个数据组成,即n为奇数,故按中位数的计算方法,得到中位数为20,即第3个数。

在偏态分布下,众数、中位数平均值存在特定的关系。当数据分布呈右偏态(正偏态)时,数据的右侧有较长的尾巴,这意味着存在一些较大的极端值。此时,平均值会受到这些较大极端值的影响而被拉高,使得平均值大于中位数,而中位数又大于众数。因为众数是数据中出现频数最多的值,不受极端值的影响;中位数是将数据按大小顺序排列后位于中间位置的值,极端值对其影响相对较小;而平均值是所有数据的总除以数据个数,极端值会使平均值向较大值方向偏移。 当数据分布呈左偏态(负偏态)时,数据的左侧有较长的尾巴,即存在一些较小的极端值。这时,平均值会被这些较小的极端值拉低,导致平均值小于中位数中位数小于众数。 例如,在收入数据中,如果少数人拥有极高的收入,数据会呈现右偏态,此时平均收入会高于中位数收入众数收入;若存在少数极低的收入情况,数据可能呈左偏态,平均收入会低于中位数收入众数收入。 ```python import numpy as np import matplotlib.pyplot as plt from scipy.stats import skew # 生成右偏态数据 right_skewed_data = np.random.gamma(2, 2, 1000) skewness = skew(right_skewed_data) # 计算众数、中位数平均值 mode = np.argmax(np.bincount(right_skewed_data.astype(int))) median = np.median(right_skewed_data) mean = np.mean(right_skewed_data) print(f"右偏态数据 - 众数: {mode}, 中位数: {median}, 平均值: {mean}, 偏度: {skewness}") # 生成左偏态数据 left_skewed_data = -np.random.gamma(2, 2, 1000) skewness = skew(left_skewed_data) # 计算众数、中位数平均值 mode = np.argmax(np.bincount((left_skewed_data + abs(left_skewed_data.min())).astype(int))) median = np.median(left_skewed_data) mean = np.mean(left_skewed_data) print(f"左偏态数据 - 众数: {mode}, 中位数: {median}, 平均值: {mean}, 偏度: {skewness}") # 绘制右偏态数据直方图 plt.hist(right_skewed_data, bins=30, density=True, alpha=0.7, color='b') plt.axvline(x=mean, color='r', linestyle='--', label='Mean') plt.axvline(x=median, color='g', linestyle='--', label='Median') plt.axvline(x=mode, color='y', linestyle='--', label='Mode') plt.title('Right Skewed Distribution') plt.xlabel('Value') plt.ylabel('Density') plt.legend() plt.show() # 绘制左偏态数据直方图 plt.hist(left_skewed_data, bins=30, density=True, alpha=0.7, color='b') plt.axvline(x=mean, color='r', linestyle='--', label='Mean') plt.axvline(x=median, color='g', linestyle='--', label='Median') plt.axvline(x=mode, color='y', linestyle='--', label='Mode') plt.title('Left Skewed Distribution') plt.xlabel('Value') plt.ylabel('Density') plt.legend() plt.show() ```
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值