概率表达了在给定参数条件θ\thetaθ下,样本X=xX=xX=x的可能性是多大。
而似然表示的是在给定样本X=xX=xX=x时,参数θ\thetaθ的可能性。
例如在离散情况下:
L(θ1∣x)=Pθ1(X=x)>Pθ2(X=x)=L(θ2∣x)
L(\theta_1|x)=P_{\theta_1}(X=x) > P_{\theta _2}(X=x) = L(\theta_2|x)
L(θ1∣x)=Pθ1(X=x)>Pθ2(X=x)=L(θ2∣x)
如果上式成立,则在参数θ1\theta_1θ1下随机变量XXX取到xxx值的可能性大于θ2\theta_2θ2。
同样在连续情况下也类似。
极大似然估计
在一次抽样中,得到观测值x1,x2...xnx_1,x_2...x_nx1,x2...xn。选取θ′(x1,x2...xn)\theta^\prime(x_1,x_2...x_n)θ′(x1,x2...xn)作为θ\thetaθ的估计值,使得θ=θ′(x1,x2...xn)\theta=\theta^\prime(x_1,x_2...x_n)θ=θ′(x1,x2...xn)时样本出现的概率最大。
离散型样本:
L(θ)=Πi=1np(xi;θ)
L(\theta)=\Pi_{i=1}^np(x_i;\theta)
L(θ)=Πi=1np(xi;θ)
连续型样本:
L(θ)=Πi=1nf(xi;θ)
L(\theta)=\Pi_{i=1}^nf(x_i;\theta)
L(θ)=Πi=1nf(xi;θ)
极大似然估计:
L(x1,x2,...,xn;θ^)=maxθ∈ΘL(x1,x2,...,xn;θ)
L(x_1,x_2,...,x_n;\hat\theta) = max_{\theta \in \Theta}L(x_1,x_2,...,x_n;\theta)
L(x1,x2,...,xn;θ^)=maxθ∈ΘL(x1,x2,...,xn;θ)
求解θ\thetaθ
- 构造似然函数:L(θ)L(\theta)L(θ)
- 对似然函数取对数:lnL(θ)lnL(\theta)lnL(θ)。因为不影响极值点,所以可以取对数。
- 求偏导∂lnL∂θ=0\frac {\partial lnL}{\partial \theta} = 0∂θ∂lnL=0
- 求解得到θ\thetaθ