最近在准备组会所讲的内容,我们讲得就是极大似然和EM算法,对极大似然有一点自己的理解,在此分享出来。
似然函数:我把它想象成对一件已经发生过的事件A的概率。然而这个事件A里面包含着有许多其它事件的发生。所以我就把这些其它事件发生的联合概率来作为事件A的概率,也就是似然函数。数据类型的不同(离散型和连续性)就有不同的似然函数:
∏是连乘符号
极大似然:那就是让这个函数的指最大。为什么要最大了:按照我们的理解,发生过的事情,我们再去谈概率,概率就应该是1,但是我们知道在事件还未发生前的概率是不可能为1的,故而一般情况下,我们是不可能让似然函数的值为1的,但是我们可以让它达到最大,尽最大可能的去符合事实。
例子:
一个袋子里有无数个球,球的表面的颜色有黑红两种,我们从中选取10个球来估计从这个袋子里面取到黑色球的概率是多少。假设取出来的十个球里面有三个黑球,一七个红球,那么我们一看数据就可以估计出从袋子中选取黑球的概率是3/10,红球的是7/10.但是我们这样是否缺乏一个合理的数学推导了?
这时候就有极大似然估计出来了:见下表格:我们可以设从这个袋子中取出的黑球的概率为θ,则取出红球的概率就为1-θ。因为我们已经取出来n个球,并且这n个球的具体颜色我们都清楚,具体情况如下表所示,故有似然函数:
我们把n=10,n_1=3,n_2=7,带入会得到当θ=3/10,极大似然函数会有最大值,也就是当取到黑球的概率为3/10时,这个事件(取10个并且其中有三个是黑球)最有可能发生。
极大似然函数就用一种近似数学的方式去退出事件发生的概率,相比较之前按照比例来估计概率,极大似然似乎更具有数学的推理和严谨性。但本质上还是帮助我们根据观察出来的事件去退出某事件的发生概率。
分享出来,记录学习进度,冲冲冲,卷卷卷!!!