维基简介
在统计学中平均数是一组数据的中间值或典型值 。不同的平均数概念被用在不同的地方。通常我们所说的平均数是算术平均数,就是对数据求和后再除以数据的个数。在统计学中,均值,中间值和众数都用作对数据集中趋势(central tendency)的测量。所以它们三个也可以被称为平均数。
In colloquial language, an average is a middle or typical number of a list of numbers. Different concepts of average are used in different contexts. Often “average” refers to the arithmetic mean, the sum of the numbers divided by how many numbers are being averaged. In statistics, mean, median, and mode are all known as measures of central tendency, and in colloquial usage sometimes any of these might be called an average value.
举例说明
通过上面的解释我们可以看出平均值是用来描述一组数据的集中趋势的。举个例子来说,在数学史上高尔顿在伦敦成立了生物统计实验室,并打广告动员不同的家庭来做测量。在这个实验,他搜集身高、体重数据,测量特殊的骨骼和家庭成员的其他特性。通过对比数据他发现“向平均回归”(regression to the mean)的现象,表现为:非常高的父亲,其儿子往往比父亲矮一些;而非常矮的父亲,其儿子往往比父亲高一些。从这里我们也可以了解平均数的意义,就是我们如果得到了人类身高的平均数,我们就可以对单独的个体的身高进行估计,估计的值就是平均数上下范围。
均值、中位数、众数
均值、中位数、众数三者都可以认为是平均数,那么要如何判断该使用哪个平均数呢?
- 一般我们都是用均值来表示平均值,但是这是在保证均值无偏的情况下。
- 均值容易受到异常值(极大值或极小值的影响),这时候我们就要用中位数。
数据的分布向右斜偏,均值就会大于中位数,数据的分布向左斜偏,均值就会小于中位数。 - 当数值呈现双峰分布时,可以使用众数。也就是说当数据是类别数据,可以分为两组或多组时,就可以使用众数。