例子1:糖果公司用一个100粒糖球的样本得出口味持续时间均值的点估计量为62.7分钟,同时总体方差的点估计量为25分钟,这里的均值估计量是根据样本得出的,而方差是总体方差
一般来说给出一个区间比给出一个精确的值更保险一些,此例正是为了获取这个区间,
P(a<μ小于b) = 95%
这样的话大部分样本的均值都落在这个范围内了
选择总体统计量 口味持续时间的均值
求其抽样的分布 100粒糖球为一个抽样,求抽样均值的分布
根据之前样本均值的分布,我们知道当n足够大时,其服从正态分布
X¯¯¯ ~ N(μ,σ²/n)
=>
X¯¯¯ ~ N(μ,25/100)
=>
X¯¯¯ ~ N(μ,0.25)
要注意的是这里其实是在用抽样均值的分布计算总体均值的置信区间
决定置信水平
95%
求出置信上下限
①确定概率的上下限
P(X¯¯¯ < a) = 0.025
p(X¯¯¯ > b) = 0.025
p( b < X¯¯¯ < a) = (1 - 0.025) - 0.025 = 0.95
②对X¯¯¯标准化
Z = (X¯¯¯ - μ) / 0.25−−−−√
Z ~ N(0,1)
③根据P(Z < Za) = 0.025, P(Z > Zb) = 0.025
分别算出Za和Zb分别为-1.96和1.96
P(-1.96 < (X¯¯¯ - μ) /0.5 < 1.96 )= 0.95
P(X¯¯¯-0.98 < μ < X¯¯¯ + 0.98) = 0.95
④由于样本均值是有的,所以X¯¯¯ = 62.7
所以X¯¯¯的上下限就是(62.7-0.98,62.7+0.98)