参数的点估计问题与矩估计法

本文介绍了机器学习中的参数估计问题,特别是点估计的概念,并详细讲解了矩估计法及其应用实例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习的许多公式推导都涉及了数理统计的内容,特别是参数估计对理解机器学习很重要。这里三篇文章就对三种参数估计方法进行简单介绍。

对一些数理统计的基本概念的介绍,可参考之前的文章“数理统计学的基本概念”。

参数的点估计问题

设有一个统计总体,以f(x;θ1,,θk)f(x;θ1,⋯,θk)记其概率密度函数(若总体分布为连续型的)或其概率函数(若其总体分布为离散型的)。避免重复交代这两种情况,我们约定称f(x;θ1,,θk)f(x;θ1,⋯,θk)为“总体分布”,其具体含义视其为连续型或离散型而定。这个分布包含k个位置参数θ1,,θkθ1,⋯,θk。例如,对正态总体分布N(μ,δ2)N(μ,δ2),有θ1=μθ1=μθ2=δ2θ2=δ2,而

f(x;θ1,θ2)=(2πθ2)1exp(12θ2(xθ1)2)(<x<)f(x;θ1,θ2)=(2πθ2)−1exp⁡(−12θ2(x−θ1)2)(−∞<x<∞)

若总体有二项分布B(n,p)B(n,p),则θ1=pθ1=p,而
f(x;θ1)=(nx)θx1(1θ1)nk(x=0,1,,n)f(x;θ1)=(nx)θ1x(1−θ1)n−k(x=0,1,⋯,n)

当k=1,即只有一个参数时,就用θθ代替θ1θ1

参数估计问题的一般提法是:设有了从总体中抽出样本X1,,XnX1,⋯,Xn(独立同分布),要依据这些样本去对参数θ1,,θkθ1,⋯,θk的未知值做出估计。当然我们也可以只要求估计θ1,,θkθ1,⋯,θk中的一部分,或估计他们的某个已知函数g(θ1,,θk)g(θ1,⋯,θk)。例如,为要估计θ1θ1,我们需要构造出适当的统计量θ1^=θ1^(X1,,Xn)θ1^=θ1^(X1,⋯,Xn)。每当有了样本X1,,XnX1,⋯,Xn,就代入函数θ1^(X1,,Xn)θ1^(X1,⋯,Xn)中计算出一个值,用来作为θ1θ1的估计值。为着这样的特定目的而构造的统计量θ1^θ1^叫做θ1θ1的估计量。由于未知参数θ1θ1是数轴上的一个点,用θ1^θ1^去估计θ1θ1,等于用一个点估计另一个点,所以这样的估计叫做点估计,以别与区间估计。

矩估计法

矩估计法的思想比较简单:设总体分布为f(x;θ1,,θk)f(x;θ1,⋯,θk),则它的矩(原点矩和中心矩都可以,此处以原点矩为例)

αm=xmf(x;θ1,,θk)dx(ixmi)f(x;θ1,,θk)αm=∫−∞∞xmf(x;θ1,⋯,θk)dx(或∑ixim)f(x;θ1,⋯,θk))

依赖于θ1,,θkθ1,⋯,θk。另一方面,至少在样本大小n较大时,样本原点矩amam应该接近于αmαm。于是
αm=αm(θ1,,θk)am=i=1nXmi/nαm=αm(θ1,⋯,θk)≈am=∑i=1nXim/n

m=1,,km=1,⋯,k,并将上面的近似式改成等式,就得到一个方程组:
αm(θ1,,θk)=am(m=1,,k)αm(θ1,⋯,θk)=am(m=1,⋯,k)

解此方程组,得起根θ1^(X1,,Xn)(i=1,,k)θ1^(X1,⋯,Xn)(i=1,⋯,k),就以θ̂ iθ^i作为θiθi的估计(i=1,,k)(i=1,⋯,k)。如果要估计的是θ1,,θkθ1,⋯,θk的某函数g(θ1,,θk)g(θ1,⋯,θk),则用ĝ (X1,,Xn)=g(θ̂ 1,,θ̂ k)g^(X1,⋯,Xn)=g(θ^1,⋯,θ^k)去估计它。这样定出的估计量就叫做矩估计。

例子

X1,,XnX1,⋯,Xn是从正态总体N(μ,δ2)N(μ,δ2)中抽取的样本,要估计μμδ2δ2μμ是总体的一阶原点矩,按矩估计,用样本的一阶原点矩,即样本均值X去估计。δ2δ2是总体方差,即总体的二阶中心矩,可用样本的二阶中心矩m2m2去估计。一般地,在估计方差时,常用样本方差S2S2而不用m2m2,即对矩估计做了一定的修正。

参考书目
《概率论与数理统计》——陈希孺

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值