标准差和标准误差
标准差(standard deviation)和标准误差(standard error of mean)
根据国际标准化组织(ISO)的定义:标准差σ是方差σ2的正平方根;而方差是随机变量期望的二次偏差的期望。
什么是标准误差(standard error)呢?通常来说有两种定义方式:
-
样本容量为
的标准误差是样本的标准差除以
。有人用样本的标准差除以n来作为标准误差(如果标准误差是基于总体均值来估计标准差,所以也没有必要说人家错);
-
一个统计量的标准误差还可以用估计误差
的标准差来刻画即:
。
下文编辑学报郝拉娣的《标准差与标准误》
标准差作为随机误差(或真差)
的代表,是随机误差绝对值的统计均值。在国家计量技术规范中,标准差的正式名称是标准偏差,简称标准差,用符号表示。标准差的名称有10
余种,如总体标准差、母体标准差、均方根误差、均方根偏差、均方误差、均方差、单次测量标准差和理论标准差等。
标准差的定义式为:
由于上式中含有的参数:总体算术平均数 (
亦称数学期望
, 或称真值)
和总体数
,
是不能进行实际计算的
,因此,上式只有理论上的意义,
无法求出
;
而经常采用的方法是用样本参数来估计总体的参数
,即用样本标准差
的值作为总体标准差
的估计值。
用样本标准差的值作为总体标准差
的估计值。样本标准差的计算公式为:
式中
: 为样本算术平均数(
以下简称平均数);
为观测样本数。
反映了整个样本变量的分散程度
。样本标准差小
,说明样本变量的分布比较密集在平均数附近,否则
,表明样本的分布比较离散。当
时,
趋向于
。
样本平均数的标准误及其估计
在抽样试验(
或重复的等精度测量)
中
,常用到样本平均数的标准差,亦称样本平均数的标准误或简称标准误(
standard error of mean) 。因为样本标准差不能直接反映样本平均数
与总体平均数
究竟误差多少,
所以,
平均数的误差实质上是样本平均数与总体平均数之间的相对误差。可推出样本平均数的标准误为
与总体标准差类似
,样本平均数的标准误
也无法求出,只能估计。为了区别是用样本标准差
的值来估计总体标准差
的值,
样本平均数的标准误
的估计值用
表示(
也称平均数的标准偏差
),即
反映了样本平均数的离散程度。标准误越小,
说明样本平均数与总体平均数越接近,
否则
,表明样本平均数比较离散。当
时
,
趋向于
在表达有随机误差的实验结果数据中
, 我们常见到“平均数
±标准差”
中的“标准差”
, 实际上是指总体标准差的估计值,在以下的讨论中如无特别指明
,标准差均指样本标准差
。
标准差与标准误的区别
标准差与标准误的意义、作用和使用范围均不同。标准差(
亦称单数标准差)
一般用表示,
是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标
; 而标准误一般用
表示,
反映样本平均数对总体平均数的变异程度,
从而反映抽样误差的大小
,是量度结果精密度的指标。
随着样本数(
或测量次数)的增大
, 标准差趋向某个稳定值,即样本标准差
越接近总体标准差σ,而标准误则随着样本数(
或测量次数)n
的增大逐渐减小,即样本平均数越接近总体平均数
μ; 故在实验中也经常采用适当增加样本数(
或测量次数)
减小
的方法来减小实验误差,
但样本数太大意义也不大
。
标准差是最常用的统计量, 一般用于表示一组样本变量的分散程度; 标准误一般用于统计推断中, 主要包括假设检验和参数估计 ,如样本平均数的假设检验、参数的区间估计与点估计等[ 3]。
标准差与标准误既有明显区别
,又密切相关:
标准误是标准差的 ;
二者都是衡量样本变量(观测值)
随机性的指标,
只是从不同角度来反映误差
;M 、S . D .
、S . E .
分别是平均数
mean 、标准差standarddeviation
、标准误
standarderror 的英文缩写。
GB 3358 —82《统计学名词及符号的规定》已对一些常用统计学符号作了明确规定:
统计学符号一般用斜体,
但有大小写之分,如(
样本大小)、
(
样本的算术平均数)、
(
标准差)、
(
标准误)、
(
平均数
±标准差)、
(
平均数
±标准误)
等
。因此,
正确的表示是:“平均数
±标准差”为“
”
; “平均数
±标准误”为“
”
。而英文
”和用中文“平均数±标准差”“平均数±标准误”都属于用量名称表示,
除此之外
,均属于不正确的表示