一个问题
在复习概率论与数理统计的时候,发现一个有趣的例子:
两家医院,大医院每天新生儿45个,小医院新生儿15个,问一年内哪家医院男新生儿比例超过60%的天数多的可能性大?
乍眼一看,直觉告诉我新生儿的自然男女比例应该固定在50%左右的某个值,两家医院的男女概率应该都是这个值,所以两家医院的可能性相同。
答案明显没那么简单。
这里想引入两个定律:
伯努利大数定律
设μn是n重伯努利试验中事件A发生的次数,已知在每次试验中A发生的概率为p(0<p<1),则对任意ϵ>0,有
即μnn→p或P−limn→∞μnn=p
大数定律的意思是如果一个事件A的概率为p,那么大量重复试验中事件A发生的概率将逐渐稳定到概率p。
但大数定律并没有告诉我们,当n充分大时,P{|μnn−p|>ϵ}的概率到底有多大。此时引入中心极限定理。
中心极限定理
(林德伯格-列维)设ξ1,ξ2,…,ξn,…是一列独立同分布的随机变量,且Eξi=μ,D(ξi)=σ2>0,i=1,2,…,则有
即∑ni=1ξi−nμn√σ∼N(0,1)
大数定律没有告诉我们P{|μnn−p|>ϵ}的概率到底有多大,但中心极限定理告诉了我们:
这个分布告诉我们,当n越大时,1n∑ni=1ξi−μ服从的正态分布的方差越小,1n∑ni=1ξi靠近μ的概率就越大。
解答
回到新生儿问题,大医院一天的样本量比小医院的样本量要多,所以大医院1n∑ni=1ξi−μ服从的正态分布的方差要比小医院的小,所以大医院在x=0.1(60%-50%)的概率要比小医院的小,即大医院一天男新生儿多于60%的可能性比小医院的要小。
所以正确答案是小医院的可能性大。