极大似然估计
mongoo
2013-09-25
S 小城镇只有 A, B 俩咖啡店. A, B 俩咖啡店只卖'焦糖玛奇朵'和'卡布奇诺'两种. 且并不接受订单, 随机给出一杯咖啡. 小明刚来到 S 小城镇,
想喝'卡布奇诺', 你会推荐他去哪一家店?
曾有人想摸透 A, B两家店给出 '卡布奇诺'的概率, 召集了9个朋友一起轮班去两家喝咖啡, 并给出了以下7组数据
序号 | 店铺 | 喝到'卡布奇诺'人数 |
1 | A | 9 |
2 | B | 5 |
3 | A | 6 |
4 | A | 8 |
5 | B | 3 |
6 | A | 9 |
7 | B | 4 |
他们已经喝不动了. 这时有人提出这样一个结论去 A 店随机给出一杯'卡布奇诺'的概率高.
一共去了A店4次. 一共喝到了 9 + 6 + 8 + 9 = 28杯 '卡布奇诺' 28/4 = 7, 所以在A店可以喝道 '卡布奇诺'的概率为 0.7
同理, B点可以喝道 '卡布奇诺'的概率为 0.4
所以他们推荐 小明去 A 点喝咖啡.
这个科学不?
我们以数学语言去描述这一件事请.
首先, 我们使用变量 X 表示喝到'卡布奇诺'人数 Z 表示在哪个店铺喝的.
A,B 店随机给出 '卡布奇诺'的概率分别记为 和
.
我们的目标是通过这7组数据来估计 的数值.
有人提出 0.7, 0.4的概率可以这样描述:
其实, 实际上这样的估计就是 maximum likelihood estimation ( 极大似然估计 ).
上面的事件在概率统计上可以以 , 参数为
的 X,Z的联合概率分布来表示.
问题就变为, 求满足这样的 X,Z的 . 因为 X,Z 可以通过统计可得出, 如
,
.
可以写成关于 的函数:
.
函数 叫做
的 likelihood function (似然函数).
我们求对 的偏导并令偏导数为0,
可以得出,
个人理解:
此题为例, 观察可得X,Z. 想要找出 ( 在A,B店喝到 '卡布奇诺'的概率 ), 且与X,Z之间有联系.
于是假设出一个函数 , 且找出使
值最大的
.
为什么 要求使其最大, 这是为什么呢?
先来看一下 ,
具体表达意义何在.
描述 : "在A,B店中喝到 '卡布奇诺'的概率",
描述: "在A,B店中喝到 '卡布奇诺'的概率为
的概率".
但事件2 为"真实事件", 即概率为1. 所以 越大, 越真实.
所以求满足 最大的
.
: likelihood function, 似然函数, 也是为一个已发生的真实事件的发生的概率函数.
因为投掷硬币中, 若投掷2次, 都出现正面. 则投掷硬币出现正面的 使其最大的
为
1. 即
.
所以极大似然估计描述已发生的真实事件的发生的概率函数,对于样本大小依赖很大.
到此, 本文结束.
具体计算似然函数求偏倒为0, 看分割线之后部分.
=======================华丽的分割线=======================
有人会想计算验证, 可乍一看肯麻烦 ( 像我数学功底不好的同学 ), 好那举一个例子来计算一下, 验证上面计算所得确实是一样.
为了简化式子, 这伙人一家只去了一次, 如下
序号 | 店铺 | 喝到'卡布奇诺'人数 |
1 | A | 9 |
2 | B | 5 |
则,
即A, B 两家店喝到 '卡布奇诺'的概率各为 0.9, 0.5
得 , 同理