极大似然估计的简单应用
1. 什么是似然函数?
本质是关于随机数X的概率密度函数,只不过没有给定参数.
概率密度函数反映的是给定
X
X
X值 的事件发生概率 (即使是连续值也可以用离散的理解方式来理解)
举例, 抛硬币的结果只有正面和反面,把正面记为
H
H
H, 反面记为
T
T
T, 假设
n
n
n次实验中出现
k
k
k个正面,这是个二项分布,假设参数
θ
\theta
θ 代表掷到正面的概率,那么其似然函数为:
P
(
X
=
k
)
=
(
n
k
)
θ
k
(
1
−
θ
)
n
−
k
(
k
=
1
,
2
,
3
,
4...
)
P(X = k) = \binom{n}{k} \theta^k(1-\theta)^{n-k} (k = 1,2,3,4...)
P(X=k)=(kn)θk(1−θ)n−k(k=1,2,3,4...)
2. 如何用最大似然估计估计似然函数的参数值?
本质上就是求 θ \theta θ, 利用 X X X的样本数据. 比如我们扔了10组硬币,每次扔20次,记录其中正面的次数记作 X i i = 1 , 2 , 3...10 X_{i} i= 1,2,3...10 Xii=1,2,3...10, 那么求 θ \theta θ的方法如下:
- 把 n = 20 n = 20 n=20 和 X i X_{i} Xi代入10个样得到10个概率密度函数
- 将这10个函数相乘得到一个新的函数
- 把这个函数对 θ \theta θ求导, 令导数值为0,求得 θ \theta θ
至此,求值完毕,把 θ \theta θ代入原来的似然函数,得到 X X X的概率密度函数.