大数定律&中心极限定理

切比雪夫不等式与大数定律:随机变量的统计特性,

1.切比雪夫不等式

切比雪夫不等式可以对随机变量偏离期望值的概率做出估计,这是大数定律的推理基础。以下介绍一个对切比雪夫不等式的直观证明。

1.1 示性函数

对于随机事件A,我们引入一个示性函数IA={1,A发生0,A不发生I_A=\begin{cases} 1&,\text{A发生} \\ 0&,\text{A不发生} \end{cases}IA={10,A发生,A不发生,即一次实验中,若AAA发生了,则III的值为1,否则为0。

现在思考一个问题:这个函数的自变量是什么?

我们知道,随机事件在做一次试验后有一个确定的观察结果,称这个观察结果为样本点ω\omegaω,所有可能的样本点的集合称为样本空间$\Omega =\left { \omega \right } ,称,称,称\Omega的一个子集的一个子集的一个子集A$为随机事件。

例如,掷一个六面骰子,记得到数字kkk的样本点为ωk\omega_kωk,则Ω={ω1,ω2,ω3,ω4,ω5,ω6}\Omega = \{\omega_1,\omega_2,\omega_3,\omega_4,\omega_5,\omega_6\}Ω={ω1,ω2,ω3,ω4,ω5,ω6},随机事件“得到的数字为偶数”为A={ω2,ω4,ω6}A = \{\omega_2,\omega_4,\omega_6\}A={ω2,ω4,ω6}

由此可知,示性函数是关于样本点的函数,即
IA(ω)={1,ω∈A0,ω∉A(试验后)I_A(\omega)=\begin{cases} 1&,\omega \in A \\ 0&,\omega \notin A \end{cases} \text {(试验后)}IA(ω)={10,ωA,ω/A(试验后)

在试验之前,我们能获得哪个样本点也是未知的,因此样本点也是个随机事件,记为ξ\xiξ,相应的示性函数可以记为
IA={1,ξ∈A0,ξ∉A(试验前)I_A=\begin{cases} 1&,\xi \in A \\ 0&,\xi \notin A \end{cases} \text {(试验前)}IA={10,ξA,ξ/A(试验前)

在试验之前,III的值也是未知的,因此III是个二值随机变量。这样,我们就建立了随机事件AAA和随机变量III之间的一一对应关系。

III求数学期望可得
EIA=1×P(ξ∈A)+0×P(ξ∉A)=P(ξ∈A)\mathbb{E}I_A=1 \times P(\xi \in A) + 0 \times P(\xi \notin A)=P(\xi \in A)EIA=1×P(ξA)+0×P(ξ/A)=P(ξA)

P(ξ∈A)P(\xi \in A)P(ξA)是什么?是样本点落在AAA里面的概率,也就是AAA事件发生的概率P(A)P(A)P(A),由此我们就得到了示性函数很重要的性质:其期望值正是对应的随机事件的概率,即
EIA=P(A)\mathbb{E}I_A=P(A)EIA=P(A)

1.2 马尔科夫不等式

对于非负的随机变量XXX和定值aaa,考虑随机事件A={X≥a}A=\{X \ge a\}A={Xa},我们可以画出示性函数IAI_AIA关于观察值xxx的图像,如图所示:
在这里插入图片描述

容易发现IX≥a(x)≤xaI_{X \ge a}(x) \le \frac{x}{a}IXa(x)ax恒成立。把xxx换为随机变量XXX,再对该式取数学期望得
EIX≥a=P(X≥a)≤EXa\mathbb{E}I_{X \ge a}=P(X \ge a) \le \frac{\mathbb{E}X}{a}EIXa=P(Xa)aEX
称该不等式为马尔科夫Markov不等式

从理解上说,如果非负随机变量XXX的期望存在,则XXX超过某个定值aaa的概率不超过Ea\frac{\mathbb{E}}{a}aE。举个简单的例子:如果我们知道所有人收入的平均数aaa,那么随机抽一个人收入超过10a10a10a的概率不超过10%10\%10%

根据图中两个函数的差距,我们大致能理解这个不等式对概率的估计时比较粗超的。

1.3 切比雪夫不等式

对于随机变量XXX,记μ=EX\mu = \mathbb{E}Xμ=EX,考虑随机事件A={∣X−μ∣≥a}A=\{|X-\mu|\ge a\}A={Xμa},其示性函数的图像如图所示:
在这里插入图片描述

易知I∣X−μ∣≥a≤(x−μ)2a2I_{|X-\mu|\ge a}\le \frac{{(x-\mu)}^2}{a^2}IXμaa2(xμ)2恒成立。将该式xxx换成XXX并取数学期望得
EI∣X−μ∣≥a=P(∣X−μ∣≥a)≤DXa2\mathbb{E}I_{|X-\mu|\ge a}=P(|X-\mu|\ge a)\le \frac{\mathbb{D}X}{a^2}EIXμa=P(Xμa)a2DX
称上面这个不等式为切比雪夫Chebyshev不等式

从理解上来说,如果随机变量XXX的期望和方差存在,则XXX和期望值的距离大于aaa的概率不超过DXa2\frac{\mathbb{D}X}{a^2}a2DX,给定的范围越大(aaa越大),或XXX的方差越小,则偏离的概率越小,这和直觉是相符的。

同样的,切比雪夫不等式对概率的估计也比较粗糙。


2. 大数定律

对于一系列随机变量{Xn}\{X_n\}{Xn},设每个随机变量都有期望。由于随机变量之和∑i=1nXi\sum_{i=1}^{n}X_ii=1nXi很有可能发散到无穷大,我们转而考虑随机变量的均值Xˉn=1n∑i=1nXi{\bar{X}_n}=\frac{1}{n}\sum_{i=1}^{n}X_iXˉn=n1i=1nXi和其期望E(Xˉn)\mathbb{E}({\bar{X}_n})E(Xˉn)之间的距离。若{Xn}\{X_n\}{Xn}满足一定条件,当nnn足够大时,这个距离会以非常大的概率接近0,这就是大数定律的主要思想。

定义:
任取ε>0\varepsilon >0ε>0,若恒有lim⁡n→∞P(∣Xˉn−EXˉn∣<ε)=1\lim_{n \to \infty} P(\left | \bar{X}_n-\mathbb{E}\bar{X}_n \right | < \varepsilon )=1limnP(XˉnEXˉn<ε)=1,称{Xn}\{X_n\}{Xn}服从(弱)大数定律,称Xˉn\bar{X}_nXˉn依概率收敛于E(Xˉn)\mathbb{E}({\bar{X}_n})E(Xˉn),记作
Xˉn⟶PE(Xˉn)\bar{X}_n\overset{P}{\longrightarrow} \mathbb{E}({\bar{X}_n})XˉnPE(Xˉn)

2.1 马尔可夫大数定律

任取ε>0\varepsilon >0ε>0,由切比雪夫不等式可知
P(∣Xˉn−EXˉn∣<ε)≥1−D(Xˉn)ε2P(\left | \bar{X}_n-\mathbb{E}\bar{X}_n \right | < \varepsilon )\ge 1-\frac{\mathbb{D}({\bar{X}_n})}{{\varepsilon}^2}P(XˉnEXˉn<ε)1ε2D(Xˉn)
=1−1ε2n2D(∑i=1nXi)=1-\frac{1}{{\varepsilon}^2n^2}\mathbb{D}(\sum_{i=1}^{n}X_i)=1ε2n21D(i=1nXi)
由此得到马尔可夫大数定律:
如果lim⁡n→∞1n2D(∑i=1nXi)=0\lim_{n \to \infty}\frac{1}{n^2}\mathbb{D}(\sum_{i=1}^{n}X_i)=0limnn21D(i=1nXi)=0,则{Xn}\{X_n\}{Xn}服从大数定律。

2.2 切比雪夫大数定律

在马尔可夫大数定律的基础上,如果{Xn}\{X_n\}{Xn}两两不相关,则方差可以拆开:
1n2D(∑i=1nXi)=1n2∑i=1nDXi\frac{1}{n^2}\mathbb{D}(\sum_{i=1}^{n}X_i)=\frac{1}{n^2}\sum_{i=1}^{n}\mathbb{D}X_in21D(i=1nXi)=n21i=1nDXi
如果DXi\mathbb{D}X_iDXi有共同的上界c,则
1n2D(∑i=1nXi)≤ncn2=cn\frac{1}{n^2}\mathbb{D}(\sum_{i=1}^{n}X_i)\le \frac{nc}{n^2}=\frac{c}{n}n21D(i=1nXi)n2nc=nc
P(∣Xˉn−EXˉn∣<ε)≥1−cε2nP(\left | \bar{X}_n-\mathbb{E}\bar{X}_n \right | < \varepsilon )\ge 1-\frac{c}{{\varepsilon}^2n}P(XˉnEXˉn<ε)1ε2nc
由此得到切比雪夫大数定律:
如果{Xn}\{X_n\}{Xn}两两不相关,且方差有共同的上界,则{Xn}\{X_n\}{Xn}两两不相关服从大数定律。


3. 中心极限定理

大数定律研究的是一系列随机变量{Xn}\{X_n\}{Xn}的均值Xˉn=1n∑i=1nXi{\bar{X}_n}=\frac{1}{n}\sum_{i=1}^{n}X_iXˉn=n1i=1nXi是否会依概率收敛于其期望E(Xˉn)\mathbb{E}({\bar{X}_n})E(Xˉn)这个数值,而中心极限定理进一步研究Xˉn{\bar{X}_n}Xˉn服从什么分布。若{Xn}\{X_n\}{Xn}满足一定的条件,当nnn足够大时,Xˉn{\bar{X}_n}Xˉn服从正态分布,这就是中心极限定理的主要思想,这也体现了正态分布的重要性和普遍性。

3.1 独立同分布中心极限定理(林德贝格-勒维)

如果{Xn}\{X_n\}{Xn}独立同分布,且EX=μ\mathbb{E}X=\muEX=μDX=σ2>0\mathbb{D}X={\sigma}^2>0DX=σ2>0,则nnn足够大时Xˉn{\bar{X}_n}Xˉn近似服从正态分布N(μ,σ2n)N(\mu, \frac{{\sigma}^2}{n})N(μ,nσ2),即
lim⁡x→∞P(Xˉn−μσ/n<a)=Φ(a)=∫−∞a12πe−t2/2dt\lim_{x \to \infty} P(\frac{{\bar X}_n-\mu}{\sigma / \sqrt{n}}<a)=\Phi (a)=\int_{-\infty}^{a}\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dtxlimP(σ/nXˉnμ<a)=Φ(a)=a2π1et2/2dt

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值