参考文献:
【1】https://blog.youkuaiyun.com/qq_23947237/article/details/78265026;
【3】详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解_nebulaf91的博客-优快云博客_最大后验估计
-
关于几个基础概念的理解:
后验概率:
(1)实质上是指已知事件的结果,根据结果去估计事件的原因的概率分布;
(2)为便于理解,其伪公式可以写为P(因|果),数学上的表达为P(θ|x);
先验概率:
(1)实质上是指事件本身的结果并未产生,而根据历史规律估计原因的概率分布;
(2)为了便于理解,其伪公式可以写为P(因),数学上的表达为P(θ);
似然估计与似然函数:
(1)已知某原因,根据该原因来估计结果的概率分布即为似然估计;
(2)已知某原因,根据该原因来统计各种可能产生的结果的概率的函数为似然函数;
(3)为方便理解,似然估计伪公式可以写为P(果|因),数学表达式就是P(x|θ);
再识贝叶斯公式:
贝叶斯公式为:
写为更为容易理解的数学表达为:
按照定义的描述也就是:
其中,evidence指的是不必关注原因的情况下结果的概率分布情况,。
对于上式,可以理解为:结果x原因为θ的概率=原因θ产生结果x的概率/结果x的概率。进一步,更容易理解的方式可以认为是,由于原因θ产生结果x的数量为A,由各种原因(我们不关注具体是什么原因)产生所有结果x的数量为B,自然A/B就是在结果x上原因为θ的概率。
案例分析:
我们可以假设某个工作选择的案例,定义影响工作选择的因素(特征)包括收入(高/低)、位置(远/近)、规模(大/小),根据各个特征的选择不同来确定选择或不选择某工作。即:
特征:{收入(高/低)、位置(远/近)、规模(大/小)}
结果:{选择/不选择}
在上述知识背景下,再来看朴素贝叶斯公式对该二分类问题中的转换形式为:
也就是说,如果推理“{收入高、位置远、公司规模大}的选择结果”实际上就只需要计算出、
的概率也就得出了预测结果。
下面分别计算:
上式在满足独立分布原则的前提下,即:
对于式中,、
、
、
、
、
、
自然可以通过训练数据集进行计算,因此对于
很容易得出,而
如法炮制。在得到上述两个概率值的大小后,预测结果应该是“选择”或“不选择”的哪一者也就一目了然了。