中心极限定理的一个例子:大小医院的新生儿

一个问题

在复习概率论与数理统计的时候,发现一个有趣的例子:
两家医院,大医院每天新生儿45个,小医院新生儿15个,问一年内哪家医院男新生儿比例超过60%的天数多的可能性大?

乍眼一看,直觉告诉我新生儿的自然男女比例应该固定在50%左右的某个值,两家医院的男女概率应该都是这个值,所以两家医院的可能性相同。
答案明显没那么简单。

这里想引入两个定律:

伯努利大数定律

μn 是n重伯努利试验中事件A发生的次数,已知在每次试验中A发生的概率为 p(0<p<1) ,则对任意 ϵ>0 ,有

limnP{|μnnp|>ϵ}=0

μnnp Plimnμnn=p

大数定律的意思是如果一个事件A的概率为p,那么大量重复试验中事件A发生的概率将逐渐稳定到概率p。

但大数定律并没有告诉我们,当n充分大时, P{|μnnp|>ϵ} 的概率到底有多大。此时引入中心极限定理。

中心极限定理

(林德伯格-列维)设 ξ1,ξ2,,ξn, 是一列独立同分布的随机变量,且 Eξi=μ D(ξi)=σ2>0 i=1,2, ,则有

limn{ni=1ξinμnσx}=12πxet22dt

ni=1ξinμnσN(0,1)

大数定律没有告诉我们 P{|μnnp|>ϵ} 的概率到底有多大,但中心极限定理告诉了我们:

1ni=1nξiμN(0,1nσ2)

这个分布告诉我们,当n越大时, 1nni=1ξiμ 服从的正态分布的方差越小, 1nni=1ξi 靠近 μ 的概率就越大。

解答

回到新生儿问题,大医院一天的样本量比小医院的样本量要多,所以大医院 1nni=1ξiμ 服从的正态分布的方差要比小医院的小,所以大医院在x=0.1(60%-50%)的概率要比小医院的小,即大医院一天男新生儿多于60%的可能性比小医院的要小。

所以正确答案是小医院的可能性大。