置信区间分作数学期望 μ 的置信区间,标准差 σ 的置信区间,方差 σ^2 的置信区间等等。
置信区间的意义,是以样本的参数推测总体的参数。
比如用样本的平均值 X▔,推导出总体的数学期望 μ 的分布区域 。这个区域就是置信区间。
若样本的平均值 X▔ 是 35,设定的置信度是 95%,计算出来的置信区间是 33 ~ 37,那么含义就是,总体的95%的数值会在这个区间内。或者说,总体的任意一个数值,在区间内的概率为95% 。
显然,置信区间越宽,总体数值落到区间内的可能性就越大,也就是置信度越高。如果置信区间是 33 ~ 37,置信度是 95%,那么置信区间拓宽到 30 ~ 40时,置信度可超过 99%。
反之,设定的置信度越低,计算出来的区间越窄;设定的置信度越高,计算出来的区间越宽。
同样的,若设定的置信度相同,计算出来的区间越窄,说明总体数据一致性和稳定性越好,样本代表性越强,样本参数可信度越高。
若样本的数目是 n,均值为 X▔ ,标准差为 σ,则总体的数学期望 μ 的置信区间是
X▔ ± ( σ/√n ) * Z(a/2);
Z是 a 的函数,确定了a,就可以从正态分布Z表查得Z的值。
a = 1 - 置信度;若设定置信度为 95%,则 a/2 = 0.025 。