以前老是理解不了条件概率,直到近期在学习循环神经网络时,语言模型会用到条件概率,终于豁然开朗。
条件概率从字面意思来理解,P(B|A),即在A条件发生时,B发生的概率。注意条件概率成立的前提是A与B有关联,如果A与B没有关联,即P(AB)= 0,此时P(B|A)= p(AB)/P(A), 概率也为0。
当A与B有关联时,则A与B有交集,举个容易理解的例子,例如事件A表示:年龄大于30的男生患艾滋病的概率P(A)。
事件B表示:年龄小于40的男生患艾滋病的概率P(B)。
事件A发生时,事件B发生的概率P(B|A) = P(AB)/P(A)。
那么P(AB)表示年龄大于30且小于40的男生患艾滋病的概率。
P(A), P(AB)如何获取,统计获取。如果统计的是某省,就以某省全体男生作为样本集,统计的是某个国家,就以某个国家的全体男生作为样本集。
P(B|A)这样的条件概率则通过计算获取。
在真实的世界中,条件概率永远是通过计算获取,不可能出现P(AB), P(A)未知,而条件概率P(B|A)已经知晓,除非是练习题。