参数估计
在实际应用中,一个总体X的分布函数往往含有未知参数或未知参数向量 Θ ,从而可记为总体分布函数为F(x,Θ)。比如X∼P(λ),其中Θ=λ>0是未知参数,又如X∼N(μ,σ2),则Θ=(μ,σ2)是未知参数向量。解决实际问题时需要了解未知参数或未知参数向量 Θ,因此可以利用样本提供的信息,对 Θ有一个基本的估计。这就是参数估计问题。参数估计分为点估计和区间估计。极大似然估计属于点估计。
极大似然估计法
离散型
设总体X是离散型随机变量,分布律为P(X=x)=p(x,Θ),其中 Θ是未知参数。当样本X1,X2,...,Xn时,由样本的独立同分布性,记样本取得这组数据观测值的概率为
称L(Θ)为似然函数。对于给定的观测值x1,x2,...,xn,它是未知参数 Θ的函数。
下面通过一个例子介绍极大似然估计法的思想和方法。
设一袋中装有黑、白两种球。设p是从袋中随机摸得一个白球的概率,现要估计p的取值。
根据问题,我们令总体X为
则X服从0-1分布B(1,p),其中P(X=1)=p, P(X=0)=1-p.
为估计p,我们做有放回摸球10次,其结果可用随机变量表示如下:
则X1,X2,...,X10是来自总体X的一个样本。若10次摸球的结果是样本观测值(x1,x2,...,x10)=(1,0,1,0,0,0,1,0,0,0),则其似然函数为
即L(p)=p3(1−p)7是在10次摸球中出现观测值(1,0,1,0,0,0,1,0,0,0)的概率。
极大似然估计法的思想
随机试验有若干个可能的结果,如果在一次试验中某一结果出现了,有小概率事件原理,我们便自然认为这一结果出现的概率较大,从而可以认为这一结果是所有结果中出现概率最大的一个。因此p应该这样估计,即选择p^,使得上述观测值出现的概率最大。也就是说使L(p^)为L(p)的最大值。而求得L(p)的最大值点p^,可由方程
解得。本例解得p^=0.3时,L(0.3)=max{L(p)}。于是用p^=0.3作为随机取得一白球的概率的估计值是适当的。
因此,一般对离散型总体,极大似然估计值Θ^是满足
的解。
连续型
当总体X是连续型随机变量时,X的概率密度函数为f(x,Θ),其中 Θ是未知参数。若取得样本观测值(x1,x2,...,x10),则因为随机变量Xi落在点xi的邻域(设其长度为Δxi)内的概率近似于f(xi,Θ)Δxi,i=1,2,...,n,则样本(X1,X2,...,Xn)落在样本观测值(x1,x2,...,xn)邻近的概率近似为∏ni=1f(xi,Θ)Δxi。由前面例子的思想, Θ的估计值Θ^应选择使概率∏ni=1f(xi,Θ)Δxi达到最大值。但因为Δxi与 Θ无关,故只要使∏ni=1f(xi,Θ)达到最大值即可。此时,记
仍然称L(Θ)为似然函数。
极大似然估计值定义
设总体X仅含有一个未知参数Θ,并且总体的分布律或密度函数已知,x1,x2,...,xn为一组样本观测值。若存在 Θ的一个值Θ^(x1,x2,...,xn)=Θ^,使得
则称Θ^=Θ^(x1,x2,...,xn)是 Θ的极大似然估计值。而统计量Θ^(X1,X2,...,Xn)称为 Θ的极大似然估计量。
由定义可知,极大似然估计值可由似然方程
注意
当总体X服从单峰分布时,若似然方程有解,则其解就是Θ的极大似然估计值。所谓单峰分布指其密度函数图像或其概率分布图只有一个峰。常见分布中除去均匀分布,都是单峰分布。