漫步数理统计三十——依概率收敛

本文探讨了随机变量依概率收敛的概念,并通过几个定理详细阐述了这种收敛的性质。此外,还介绍了如何基于样本数据估计未知参数,并讨论了一致估计的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本篇博文我们将正式地陈述一系列随机变量靠近某个随机变量。

1{Xn}是一系列随机变量,X是定义在样本空间上的随机变量。我们说Xn依概率收敛到X,如果对于ϵ>0

limnP[|XnX|ϵ]=0

或者等价的

limnP[|XnX|<ϵ]=1

如果成立,我们一般写成

XnPX

如果XnPX,我们常说XnX的差收敛到0。极限随机变量X经常是一个常数;例如X是一个退化的随机变量。

说明依概率收敛的一种方法是用切比雪夫定理,具体会在下面的证明中给出,为了强调我们是一系列随机变量,我们在随机变量上给出下标,像X¯写成X¯n

1(弱大数定理){Xn}是一系列独立同分布的随机变量,均值为μ,方差为σ2<X¯n=n1ni=1Xi,那么

X¯nPμ

回忆一下X¯n的均值与方差分别为μ,σ2/n,因此根据切比雪夫定理,对于任意的ϵ>0

P[|X¯μ|ϵ]=P[|X¯μ|](ϵn/σ)(σ/n)σ2nϵ20

||

这个定理说明,当n取向时,X¯分布的所有质量收敛到μ。也就时候对于大的nX¯接近μ,但是多接近呢?例如如果我们用X¯n估计μ,那么估计误差是多少?这个问题留到下篇博文讲解。

还有一个强大数定理,它弱化了定理1的假设:随机变量Xi独立且都有有限的均值μ,因此强大数定理是一阶矩定理,而弱大数定理需要二阶矩存在。

还有些关于依概率收敛的定理,我们在后面会用到,首先是两个关于依概率收敛对线性封闭的定理。

2假设XnPX,YnPY,那么Xn+YnPX+Y

ϵ>0已给定,利用三角不等式可得

|XnX|+|YnY||(Xn+Yn)(X+Y)|ϵ

因为P是单调的,所以我们有

P[(Xn+Yn)(X+Y)ϵ]P[|XnX|+|YnY|ϵ]P[|XnX|ϵ/2]+P[|YnY|ϵ/2]

根据定理的假设,后两项收敛到0,从而得证。||

3假设XnPXa是一个常数,那么aXnPaX

如果a=0,结论明显成立。假设a0,令ϵ>0,那么

P[|aXnaX|ϵ]=P[|a||XnX|ϵ]=P[|XnX|ϵ/|a|]

根据假设最后一项趋于0。||

4假设XnPa且函数ga点连续,那么g(Xn)Pg(a)

ϵ>0,那么因为ga点连续,所以存在δ>0使得如果|xa|<δ,|g(x)g(a)|<ϵ,所以

|g(x)g(a)|ϵ|xa|δ

代入Xn可得

P[|g(Xn)g(a)|ϵ]P[|Xna|δ]

根据假设,最后一项在n时趋于0,得证。||

这个定理给出了许多有用的结论。例如,如果XnPa,那么

X2n1/XnXnPa2P1/a,a0Pa,a0

实际上,如果XnPXg是连续函数,那么g(Xn)Pg(X),下面的定理就用了这个结论。

5假设XnPX,YnPY,那么XnYnPXY

利用上面的结论,我们有

XnYn=12X2n+12Y2n12(XnYn)2P12X2+12Y212(XY)2=XY

现在回到采样与统计的讨论,考虑这么一种情况,随机变量X的分布有未知参数θΩ,我们要基于样本找到一个统计量来估计θ,上篇博文我们介绍了无偏性,现在介绍一致性:
2X是cdf为F(x,θ),θΩ的随机变量,X1,,XnX分布的样本且Tn表示一个统计量。我们说Tnθ的一致估计,如果

TnPθ

如果X1,,Xn是有限均值μ和方差σ2分布的随机样本,那么根据弱大数定理,样本均值X¯μ的一致估计。

1X1,,Xn表示均值为μ方差为σ2分布的随机样本,定理1说明X¯Pμ。为了说明样本均值依概率收敛到σ2,假设E[X41]<,这样的话var(S2)<。根据前面的结论可得:

S2n=1n1i=1n(XiX¯n)2=nn1(1ni=1nX2iX¯2n)P1[E(X21)μ2]=σ2

因此样本方差是σ2的一致估计。

不像上面的例子,有时候我们可以用分布函数得出收敛,如下例所示:

2X1,,Xn是均匀分布(0,θ)的随机样本,Yn=max{X1,,Xn},从Yn的cdf中很容易看出YnPθ且样本最大值是θ的一致估计。注意无偏估计((n+1)/n)Yn也是一致的。

接下里扩展下例2,根据定理1可得X¯nθ/2的一致估计,所以2X¯nθ的一致估计,注意Yn,2X¯n依概率收敛到θ的区别。对Yn而言我们用的是Yn的cdf,但对2X¯n而言,我们用的是弱大数定理。事实上2X¯n的cdf非常复杂。在许多情况下,统计量的cdf无法得到但是我们可以用近似理论来建立结论。其实还有许多其他θ的估计量,那么哪个是最好的呢?后面的文章会继续介绍。

一致性是估计量非常重要的性质,当样本数量增大时差的估计量不可能靠近目标。注意这对无偏性是不成立的。例如我们不用样本方差来估计σ2,假设用V=n1ni=1(XiX¯)2,那么Vσ2的一致估计,但是是有偏的,因为E(V)=(n1)σ2/n,所以V的偏置为σ2/n,当n时该项消失。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值