贝叶斯概率
P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( B ) P(A|B) = P(A)\frac{P(B|A)}{P(B)} P(A∣B)=P(A)P(B)P(B∣A)
P ( A ∣ B ) P(A|B) P(A∣B):条件概率,事件B发生的条件下,事件A发生的概率,也叫A的后验概率
P ( A ) P(A) P(A): 先验概率,事先不知道任何条件时A的概率。
比如,2000年8月15号天气是晴天的概率,这个事件太久远了,在不知道其它的条件下,就按照生活经验得到,先验概率 P ( A ) P(A) P(A)=0.7,但是,通过去查找天气记录,知道了2000年8月14号是雨天,这个时候再去计算 p ( A ) p(A) p(A),就是一个后验概率的问题, P ( A ∣ B ) P(A|B) P(A∣B)的概率值可能就小于0.7了。
语音增强中,
我们的目标都是想要得到先验信噪比(信号功率比上噪声功率),但是一般麦克风直接录音得到的都是带噪信号,无法直接获取纯净语音信号,这个时候其实就是得到了后验信噪比(带噪语音功率比上噪声功率),需要通过后验信噪比得到先验信噪比。
语音识别中,
P
(
W
∣
O
)
=
P
(
W
)
P
(
O
∣
W
)
P
(
O
)
P(W|O) = P(W)\frac{P(O|W)}{P(O)}
P(W∣O)=P(W)P(O)P(O∣W)
已知观测到语音序列O,要计算最有可能的词序列W,这也是一个后验概率计算的问题,通过贝叶斯公式展开后,
P
(
W
)
P(W)
P(W)是语言模型,
P
(
O
∣
W
)
P(O|W)
P(O∣W)是已知语言序列计算语音序列概率,也即是声学模型
公式解释
条件概率=先验概率*调整因子
调整因子:知道一些事实后,对先验知识进行调整
计算
举个简单例子方便理解计算过程:
两个碗:|1号和 | 2号 |
1号碗 | 2号碗 | |
---|---|---|
糖 | 30 | 20 |
巧克力 | 10 | 40 |
动作:随机取一颗零食
事件:拿到了一颗巧克力,
问题:这颗巧克力来自于1号碗的概率是多少
分析:
事件B:拿到了巧克力
事件A:来自于1号碗
求条件概率 P ( A ∣ B ) P(A|B) P(A∣B)
按照贝叶斯公式展开
P
(
A
∣
B
)
=
P
(
A
)
P
(
B
∣
A
)
P
(
B
)
P(A|B) = P(A)\frac{P(B|A)}{P(B)}
P(A∣B)=P(A)P(B)P(B∣A)
P
(
A
)
P(A)
P(A):先验概率,零食来自于1号碗的概率,这个时候只考虑零食来自于哪个碗,不分零食种类,那就是1号碗的零食数除以总零食数,因此
P
(
A
)
=
40
100
=
0.4
P(A)=\frac{40}{100}=0.4
P(A)=10040=0.4
P ( B ∣ A ) P(B|A) P(B∣A):选了1号碗,并且拿到了巧克力,这个也好算, P ( B ∣ A ) = 10 ( 10 + 30 ) = 0.25 P(B|A)=\frac{10}{(10+30)}=0.25 P(B∣A)=(10+30)10=0.25
P ( B ) P(B) P(B):拿到了巧克力的概率,这个也是先验概率,没有任何条件下,巧克力可能来自1号碗,也可能来自2号碗,那就分别算来自1号碗和来自2号碗的概率,再相加
P ( B ) = 10 ( 10 + 30 ) ∗ 0.4 + 40 ( 40 + 20 ) ∗ ( 1 − 0.4 ) = 0.5 P(B) = \frac{10}{(10+30)}*0.4 + \frac{40}{(40+20)}*(1-0.4)=0.5 P(B)=(10+30)10∗0.4+(40+20)40∗(1−0.4)=0.5
因此
P
(
A
∣
B
)
=
P
(
A
)
P
(
B
∣
A
)
P
(
B
)
=
0.4
∗
0.25
0.5
=
0.2
\begin{aligned} P(A|B) &= P(A)\frac{P(B|A)}{P(B)} \\ &=0.4 * \frac{0.25}{0.5} \\ &=0.2 \end{aligned}
P(A∣B)=P(A)P(B)P(B∣A)=0.4∗0.50.25=0.2
这里调整因子
P
(
A
)
P
(
B
∣
A
)
P
(
B
)
<
1
P(A)\frac{P(B|A)}{P(B)}<1
P(A)P(B)P(B∣A)<1,表示观测到的事实让先验概率降低了,具体对应到这个例子里就是拿到了巧克力后,再判断零食来自1号碗的先验概率应该更低了,看数据,2号碗的巧克力更多,那么从2号碗拿到巧克力的概率肯定更大,因此,拿到了是巧克力,就应该将零食来自1号碗的概率调低,符合客观感觉。同理,如果拿到的是糖,则对来自于1号碗调整因子就会大于1。