贝叶斯介绍
英国数学家,贝叶斯在数学方面主要研究概率论.对于统计决策函数、统计推断、统计的估算等做出了贡献。
他对统计推理的主要贡献是使用了"逆概率"这个概念,并把它作为一种普遍的推理方法提出来。贝叶斯定理原本是概率论中的一个定理,这一定理可用一个数学公式来表达,这个公式就是著名的贝叶斯公式。
贝叶斯定理公式:
求得是后验概率
等式右侧为先验概率
案例说明一:
假设:H代表胃癌事件,X代表胃疼事件。则P(H | X)表示的是:当一个人胃疼时,是胃癌的概率有多少? P(H | X)称为后验概率,我们利用贝叶斯公式的目的就是求得这个后验概率是多少。
而求后验的前提是要知道P(X | H ),P(H ),以及P(X )的概率。针对本例,这三个是可以根据临床试验数据得到的,
P ( X | H)表示的是:胃癌发生时,胃疼的概率,假设是:85%。P ( X | H)称为先验概率,先验概率一般是由大量过去的经验总结得到,或者也可以通过抽样得到。
比如说:电商的28定律(20%的热门商品集中了80%的访问流量)就是一个总结得到的先验概率,当然我们也可以通过抽样,通过实验数据来得到这个结论,根据大数定律,当实验样本越大,越接近于正确结论。
P(H )表示的是:总人群患胃癌的概率:0.1% P ( X)表示的是:总人群患胃疼的概率:40%
有了以上数据后,问:当一个人胃疼时,他患胃癌的概率P(X | H )是多少? 结果是:0.85*0.001%0.4=0.002125=0.021
即当一个人胃疼时,是胃癌的概率是2.1%。这个概率是很小的。
案例说明二:
比如我们要判断某一封邮件是否是垃圾邮件,假设:H代表此邮件是垃圾邮件