贝叶斯概率

本文深入解析贝叶斯公式,通过实际的碗中巧克力概率案例,演示如何计算条件概率。探讨先验概率与后验概率在语音增强和识别中的运用,以及如何利用调整因子更新知识。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

贝叶斯概率

P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( B ) P(A|B) = P(A)\frac{P(B|A)}{P(B)} P(AB)=P(A)P(B)P(BA)

P ( A ∣ B ) P(A|B) P(AB):条件概率,事件B发生的条件下,事件A发生的概率,也叫A的后验概率

P ( A ) P(A) P(A): 先验概率,事先不知道任何条件时A的概率。

​ 比如,2000年8月15号天气是晴天的概率,这个事件太久远了,在不知道其它的条件下,就按照生活经验得到,先验概率 P ( A ) P(A) P(A)=0.7,但是,通过去查找天气记录,知道了2000年8月14号是雨天,这个时候再去计算 p ( A ) p(A) p(A),就是一个后验概率的问题, P ( A ∣ B ) P(A|B) P(AB)的概率值可能就小于0.7了。

语音增强中,

​ 我们的目标都是想要得到先验信噪比(信号功率比上噪声功率),但是一般麦克风直接录音得到的都是带噪信号,无法直接获取纯净语音信号,这个时候其实就是得到了后验信噪比(带噪语音功率比上噪声功率),需要通过后验信噪比得到先验信噪比。

语音识别中,
P ( W ∣ O ) = P ( W ) P ( O ∣ W ) P ( O ) P(W|O) = P(W)\frac{P(O|W)}{P(O)} P(WO)=P(W)P(O)P(OW)
已知观测到语音序列O,要计算最有可能的词序列W,这也是一个后验概率计算的问题,通过贝叶斯公式展开后, P ( W ) P(W) P(W)是语言模型, P ( O ∣ W ) P(O|W) P(OW)是已知语言序列计算语音序列概率,也即是声学模型

公式解释

条件概率=先验概率*调整因子

调整因子:知道一些事实后,对先验知识进行调整

计算

举个简单例子方便理解计算过程:

两个碗:|1号和 | 2号 |

1号碗2号碗
3020
巧克力1040

动作:随机取一颗零食

事件:拿到了一颗巧克力,

问题:这颗巧克力来自于1号碗的概率是多少

分析:

事件B:拿到了巧克力

事件A:来自于1号碗

求条件概率 P ( A ∣ B ) P(A|B) P(AB)

按照贝叶斯公式展开
P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( B ) P(A|B) = P(A)\frac{P(B|A)}{P(B)} P(AB)=P(A)P(B)P(BA)
P ( A ) P(A) P(A):先验概率,零食来自于1号碗的概率,这个时候只考虑零食来自于哪个碗,不分零食种类,那就是1号碗的零食数除以总零食数,因此 P ( A ) = 40 100 = 0.4 P(A)=\frac{40}{100}=0.4 P(A)=10040=0.4

P ( B ∣ A ) P(B|A) P(BA):选了1号碗,并且拿到了巧克力,这个也好算, P ( B ∣ A ) = 10 ( 10 + 30 ) = 0.25 P(B|A)=\frac{10}{(10+30)}=0.25 P(BA)=(10+30)10=0.25

P ( B ) P(B) P(B):拿到了巧克力的概率,这个也是先验概率,没有任何条件下,巧克力可能来自1号碗,也可能来自2号碗,那就分别算来自1号碗和来自2号碗的概率,再相加

P ( B ) = 10 ( 10 + 30 ) ∗ 0.4 + 40 ( 40 + 20 ) ∗ ( 1 − 0.4 ) = 0.5 P(B) = \frac{10}{(10+30)}*0.4 + \frac{40}{(40+20)}*(1-0.4)=0.5 P(B)=(10+30)100.4+(40+20)40(10.4)=0.5

因此
P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( B ) = 0.4 ∗ 0.25 0.5 = 0.2 \begin{aligned} P(A|B) &= P(A)\frac{P(B|A)}{P(B)} \\ &=0.4 * \frac{0.25}{0.5} \\ &=0.2 \end{aligned} P(AB)=P(A)P(B)P(BA)=0.40.50.25=0.2
这里调整因子 P ( A ) P ( B ∣ A ) P ( B ) < 1 P(A)\frac{P(B|A)}{P(B)}<1 P(A)P(B)P(BA)<1,表示观测到的事实让先验概率降低了,具体对应到这个例子里就是拿到了巧克力后,再判断零食来自1号碗的先验概率应该更低了,看数据,2号碗的巧克力更多,那么从2号碗拿到巧克力的概率肯定更大,因此,拿到了是巧克力,就应该将零食来自1号碗的概率调低,符合客观感觉。同理,如果拿到的是糖,则对来自于1号碗调整因子就会大于1。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值