漫步数理统计六——条件概率与独立(下)

本文通过多个实例详细解析了概率计算中的关键概念,包括先验概率、后验概率、独立事件等,展示了如何应用贝叶斯定理进行条件概率计算。

$$\textbf{例5:}$瓶$C_1$中有$3$个红球,$7$个白球,瓶$C_2$中有$8$个红球,$2$个白球,这些球大小与形状都是一样的,现在假设选择瓶$C_1$的概率为$P(C_1)=\frac{2}{6}$,而选$C_2$的概率为$P(C_2)=\frac{4}{6}$。选完瓶子后我们随机抽一个球,抽到红球的事件用$C$表示,显然条件概率$P(C|C_1)=\frac{3}{10},P(C|C_2)=\frac{8}{10}$,那么在抽到红球的条件下,是瓶$C_1$的条件概率为
\begin{align*}
P(C_1|C)
&=\frac{P(C_1)P(C|C_1)}{P(C_1)P(C|C_1)+P(C_2)P(C|C_2)}\
&=\frac{(\frac{2}{6})(\frac{3}{10})}{(\frac{2}{6})(\frac{3}{10})+(\frac{4}{6})(\frac{8}{10})}=\frac{3}{19}
\end{align*}

同样得我们可得P(C2|C)=1619

在例5中,概率P(C1)=26,P(C2)=46称为C1,C2的先验概率,因为他们是已知的。观察到是红球以后,条件概率P(C1|C)=319,P(C2|C)=1619称为后验概率。因为C2中红球的比例比C1中大,所以直觉上我们认为P(C2|C)应该比P(C1|C)大,并且P(C1|C)应该比P(C1)要小。贝叶斯定理提供了精确算出他们概率是多少的方法。

6三个工厂C1,C2,C3分别占公司百分之10,50,40的产出,虽然C1产出规模小,但是其产品质量很高,只有百分之1的残品率,其他两个工厂C2,C3的残品率分别是百分之34,所有产品最终会送到同一个仓库,现在我们随机抽一个产品,其是残品的事件记为C,接下来我们来计算该产品来自C1的条件概率。我们很自然会得到P(C1)=0.1,P(C2)=0.5,P(C3)=0.4,残品的条件概率为P(C|C1)=0.01,P(C|C2)=0.03,P(C|C3)=0.04,那么给定一个次品,C1的后验概率是

P(C1|C)=P(C1C)P(C)=(0.1)(0.01)(0.1)(0.01)+(0.5)(0.03)+(0.4)(0.04)

等于132;这比先验概率P(C1)=116 要小。这是因为产品为残品的事实降低了其来自高质量C1的机会。

7假设我们想调查某个人群中受虐儿童的比例,我们感兴趣的事件是:受虐(A)与它的补,即不受虐(N=Ac)。为了我们假设P(A)=0.01,那么P(N)=0.99,当然是否受虐是基于医生的鉴定,因为医生不一定就能做出完美的结论,他们时候会把受虐的儿童(A)判定成未受虐的(ND),另一方面,也可能把为未受虐的(N)分为受虐的AD。假设误分的错误率为P(ND|A)=0.04,P(AD|N)=0.05;那么正确分类的概率是P(ND|A)=0.96,P(AD|N)=0.95,现在我们计算随机选一个孩子,他被医生分成受虐儿童的概率。因为会有两种情况AAD,NAD,所以我们有P(AD)=P(AD|A)P(A)+P(AD|N)P(N)=(0.96)(0.01)+(0.05)(0.99)=0.0591,它比受虐儿童的概率0.01要高。进一步,当一个儿童被医生判定为受虐待,而实际就是受虐待的概率为

P(A|AD)=P(AAD)P(AD)=(0.96)(0.01)0.0591=0.1624

同样的我们可以计算一个儿童被医生判定为受虐待而实际没有受虐嗲的概率为0.8376。这些概率相对真实概率比较不靠谱,原因在于医生的误差率比受虐儿童的0.01还高。

有时事件C1的发生不会影响C2的概率,这里P(C1)>0,即

P(C2|C1)=P(C2)

这时候我们称事件C1,C2是独立的,而且乘法法则变成

P(C1C2)=P(C1)P(C2|C1)=P(C1)P(C2)

反过来当P(C2)>0时有

P(C1|C2)=P(C1C2)P(C2)=P(C1)P(C2)P(C2)=P(C1)

注意,如果P(C1)>0,P(C2)>0,那么根据上面的讨论,独立等价于

P(C1C2)=P(C1)P(C2)(1)

那么P(C1)=0或者P(C2)=0会怎样呢?这时候,等式1的右边是0,左边也是0,因为C1C2C1,C1C2C2。因此我们取等式1作为独立的正式定义;即

1C1,C2是两个事件,如果等式1成立,我们就说C1,C2是独立的。

假设C1,C2是独立事件,那么下面三个事件是独立的:C1,Cc2Cc1,C2Cc1,Cc2

1独立的事件有时候称为统计独立,随机独立或者依概率独立,多数情况下,如果不引起误解我们一般用独立。

8红白双方分别掷骰子,如果C1表示红方掷出4C2表示白方掷出3P(C1)=16,P(C2)=16,那么根据独立性,有序数对(4,3)的概率是

P[(4,3)]=(16)(16)=136

数对和等于7的概率是

P[(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)]=(16)(16)+(16)(16)+(16)(16)+(16)(16)+(16)(16)+(16)(16)=636

同样得,我们可以算出和为2,3,4,5,6,7,8,9,10,11,12的概率分别为

136,236,336,436,536,636,536,436,336,236,136,

假设有三个事件C1,C2,C3,当且仅当他们每对独立即

P(C1C3)=P(C1)P(C3),P(C1C2)=P(C1)P(C2),P(C2C3)=P(C2)P(C3),


P(C1C2C3)=P(C1)P(C2)P(C3)

时,我们称他们互相独立。对于n个事件C1,C2,,Cn,当且仅当对每k个集合,2kn,下面事实为真:

d1,d2,,dk1,2,,n中不同的整数;那么

P(Cd1Cd2Cdk)=P(Cd1)P(Cd2)P(Cdk)

另外对任意两个由这些事件以及他们的补构成的组合也是独立的,例如

  1. 事件Cc1C2Cc3C4是独立的;
  2. 事件C1Cc2,Cc3C4Cc5是互相独立的。

在不引起误解的情况下,在考虑多于两个事件时我们依然用独立,而不是互相独立。

我们经常会执行一些随机试验,这些事件互相是独立的。为了简便我们将这些事件称为独立试验,也就是说各个事件是独立的,因此我们经常独立的抛硬币或独立的掷骰子。

9独立地掷几次硬币,令事件Ci表示第i 次头(H)朝上;那么Cci表示尾(T)朝上。假设CiCci是等可能的;即P(Ci)=P(Cci)=12,所以像HHTH这样有序数列的概率是

P(C1C2Cc3C4)=P(C1)P(C2)P(Cc3)P(C4)=(12)4=116

同样得,第三次头朝上的概率是

P(Cc1Cc2C3)=P(Cc1)P(Cc2)P(C3)=(12)3=18

另外四次中至少有一次头朝上的概率为

P(C1C2C3C4)=1P[(C1C2C3C4)c]=1P(Cc1Cc2Cc3Cc4)=1124=1516

10有一个计算系统,如果组件K1发生故障,那么使用K2,如果K2发生故障,那么使用K3。 假设k1发生故障的概率是0.01K2发生故障的概率是0.03K3发生故障的概率是0.08。 而且我们假设这三个组件发生故障是互相独立的,那么这系统发生故障的概率是

(0.01)(0.03)(0.08)=0.000024

因此系统不发生故障的概率是10.000024=0.999975

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值