大数定理及中心极限定理
一、大数定理
弱大数定理(辛钦大数定理)
设X1, X2, … 是相互独立,服从同一分布的随机变量序列,且具有数学期望E(Xk)=μ\muμ (k=1,2,…)。作前n个变量的算术平均1n∑k=1nXk\frac{1}{n}\sum\limits_{k=1}^{n}X_kn1k=1∑nXk,则对于任意ϵ>0\epsilon>0ϵ>0,有
limn→∞P{∣1n∑k=1nXk−μ∣<ϵ}=1\lim\limits_{n\to\infty}P\{|\frac{1}{n}\sum\limits_{k=1}^{n}X_k-\mu|<\epsilon\}=1n→∞limP{∣n1k=1∑nXk−μ∣<ϵ}=1
依概率收敛
设Y1, Y2, …, Yn, … 是一个随机变量序列,a是一个常数。若对于任意正数ϵ\epsilonϵ,有limn→∞P{∣Yn−a∣<ϵ}=1\lim\limits_{n\to\infty}P\{|Y_n-a|<\epsilon\}=1n→∞limP{∣Yn−a∣<ϵ}=1,则称序列Y1, Y2, …, Yn, … 依概率收敛于a,记为Yn→PaY_n\xrightarrow{P}aYnPa.
依概率收敛的序列有以下的性质:
设Xn→PaX_n\xrightarrow{P}aXnPa,Yn→PbY_n\xrightarrow{P}bYnPb,又设函数g(x,y)在点(a,b)连续,则g(Xn,Yn)→Pg(a,b)g(X_n,Y_n)\xrightarrow{P}g(a,b)g(Xn,Yn)Pg(a,b)
弱大数定理又可叙述为(辛钦大数定理)
设随机变量X1, X2, … 相互独立,服从同一分布且具有数学期望E(Xk)=μ\muμ (k=1,2,…)。则序列X‾=1n∑k=1nXk\overline{X}=\dfrac{1}{n}\sum\limits_{k=1}^{n}X_kX=n1k=1∑nXk依概率收敛于μ\muμ,即X‾→Pμ\overline{X}\xrightarrow{P}\muXPμ.
辛钦大数定理推论:伯努利大数定理
设fA是n次独立重复实验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数ϵ>0\epsilon>0ϵ>0,有
limn→∞P{∣fAn−p∣<ϵ}=1\lim\limits_{n\to\infty}P\{|\frac{f_A}{n}-p|<\epsilon\}=1n→∞limP{∣nfA−p∣<ϵ}=1
或
limn→∞P{∣fAn−p∣⩾ϵ}=0\lim\limits_{n\to\infty}P\{|\frac{f_A}{n}-p|\geqslant\epsilon\}=0n→∞limP{∣nfA−p∣⩾ϵ}=0
当实验次数很大时,可以用事件的频率代替事件的概率。
二、中心极限定理
定理一(独立同分布的中心极限定理)
设随机变量X1, X2, …, Xn, … 相互独立,服从同一分布,且具有数学期望和方差:E(Xk)=μ\muμ, D(Xk)=σ2\sigma^2σ2>0 (k=1,2,…),则随机变量之和∑k=1nXk\sum\limits_{k=1}^{n}X_kk=1∑nXk的标准化变量
Yn=∑k=1nXk−E(∑k=1nXk)D(∑k=1nXk)=∑k=1nXk−nμnσY_n=\dfrac{\sum\limits_{k=1}^{n}X_k-E(\sum\limits_{k=1}^{n}X_k)}{\sqrt{D(\sum\limits_{k=1}^{n}X_k)}}=\dfrac{\sum\limits_{k=1}^{n}X_k-n\mu}{\sqrt{n}\sigma}Yn=D(k=1∑nXk)k=1∑nXk−E(k=1∑nXk)=nσk=1∑nXk−nμ
的分布函数Fn(x)对于任意x满足
limn→∞Fn(x)=limn→∞P{∑k=1nXk−nμnσ⩽x}=∫−∞x12πσ e−t2/2dt=Φ(x)\lim\limits_{n\to\infty}F_n(x)=\lim\limits_{n\to\infty}P\{ \dfrac{\sum\limits_{k=1}^{n}X_k-n\mu}{\sqrt{n}\sigma}\leqslant x\}=\int_{-\infty}^{x}\dfrac{1}{\sqrt{2\pi}\sigma}\ e^{-t^2/2}dt=\Phi(x)n→∞limFn(x)=n→∞limP{nσk=1∑nXk−nμ⩽x}=∫−∞x2πσ1 e−t2/2dt=Φ(x)
即∑k=1nXk−nμnσ近似地~N(0,1)\dfrac{\sum\limits_{k=1}^{n}X_k-n\mu}{\sqrt{n}\sigma}\utilde{\footnotesize 近似地}N(0,1)nσk=1∑nXk−nμ近似地N(0,1)
在一般情况下,很难求出n个随机变量之和∑k=1nXk\sum\limits_{k=1}^{n}X_kk=1∑nXk的分布,独立同分布中心极限定理表明,当n充分大时,可以通过标准正态分布Φ(x)\Phi(x)Φ(x)给出其近似的分布。
独立同分布中心极限定理的另一种形式:
将∑k=1nXk−nμnσ\dfrac{\sum\limits_{k=1}^{n}X_k-n\mu}{\sqrt{n}\sigma}nσk=1∑nXk−nμ改写为1n∑k=1nXk−μσ/n=X‾−μσ/n\dfrac{\dfrac{1}{n}\sum\limits_{k=1}^{n}X_k-\mu}{\sigma/\sqrt{n}}=\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}σ/nn1k=1∑nXk−μ=σ/nX−μ,则当n充分大时,
X‾−μσ/n近似地~N(0,1)\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}\utilde{\footnotesize 近似地}N(0,1)σ/nX−μ近似地N(0,1) 或 X‾近似地~N(μ,σ2/n)\overline{X}\utilde{\footnotesize 近似地}N(\mu,\sigma^2/n)X近似地N(μ,σ2/n)
(当n充分大时,X‾\overline{X}X无限接近μ\muμ(σ2/n\sigma^2/nσ2/n趋于0),与大数定理相符)
定理二(李雅普诺夫定理)
设随机变量X1, X2, …, Xn, … 相互独立,且具有数学期望和方差:E(Xk)=μk\mu_kμk, D(Xk)=σk2\sigma_k^2σk2>0 (k=1,2,…),记Bn2=∑k=1nσk2B_n^2=\sum\limits_{k=1}^{n}\sigma_k^2Bn2=k=1∑nσk2. 若存在正数δ\deltaδ,使得当n→∞n\to\inftyn→∞时,1Bn2+δ∑k=1nE{∣Xk−μk∣2+δ}→0\dfrac{1}{B_n^{2+\delta}}\sum\limits_{k=1}^{n}E\{|X_k-\mu_k|^{2+\delta}\}\to0Bn2+δ1k=1∑nE{∣Xk−μk∣2+δ}→0,则随机变量之和∑k=1nXk\sum\limits_{k=1}^{n}X_kk=1∑nXk的标准化变量
Zn=∑k=1nXk−E(∑k=1nXk)D(∑k=1nXk)=∑k=1nXk−∑k=1nμkBnZ_n=\dfrac{\sum\limits_{k=1}^{n}X_k-E(\sum\limits_{k=1}^{n}X_k)}{\sqrt{D(\sum\limits_{k=1}^{n}X_k)}}=\dfrac{\sum\limits_{k=1}^{n}X_k-\sum\limits_{k=1}^{n}\mu_k}{B_n}Zn=D(k=1∑nXk)k=1∑nXk−E(k=1∑nXk)=Bnk=1∑nXk−k=1∑nμk
的分布函数Fn(x)对于任意x,满足
limn→∞Fn(x)=limn→∞P{∑k=1nXk−∑k=1nμkBn⩽x}=∫−∞x12πσ e−t2/2dt=Φ(x)\lim\limits_{n\to\infty}F_n(x)=\lim\limits_{n\to\infty}P\{ \dfrac{\sum\limits_{k=1}^{n}X_k-\sum\limits_{k=1}^{n}\mu_k}{B_n}\leqslant x\}=\int_{-\infty}^{x}\dfrac{1}{\sqrt{2\pi}\sigma}\ e^{-t^2/2}dt=\Phi(x)n→∞limFn(x)=n→∞limP{Bnk=1∑nXk−k=1∑nμk⩽x}=∫−∞x2πσ1 e−t2/2dt=Φ(x).
由此,当n很大时,∑k=1nXk=BnZn+∑k=1nμk\sum\limits_{k=1}^{n}X_k=B_nZ_n+\sum\limits_{k=1}^{n}\mu_kk=1∑nXk=BnZn+k=1∑nμk近似地服从正态分布N(∑k=1nμk,Bn2)N(\sum\limits_{k=1}^{n}\mu_k, B_n^2)N(k=1∑nμk,Bn2). 这就是说,无论各个随机变量Xk (k=1,2,…) 服从什么分布,只要满足定理的条件,那么它们的和∑k=1nXk\sum\limits_{k=1}^{n}X_kk=1∑nXk当n很大时,就近似地服从正态分布。
定理三(棣莫弗—拉普拉斯定理)
设随机变量ηn\eta_nηn (n=1,2,…)服从参数为n,p(0<p<1)的二项分布,则对于任意x,有
limn→∞P{ηn−npnp(1−p)⩽x}=∫−∞x12πσ e−t2/2dt=Φ(x)\lim\limits_{n\to\infty}P\{ \dfrac{\eta_n-np}{\sqrt{np(1-p)}}\leqslant x\}=\int_{-\infty}^{x}\dfrac{1}{\sqrt{2\pi}\sigma}\ e^{-t^2/2}dt=\Phi(x)n→∞limP{np(1−p)ηn−np⩽x}=∫−∞x2πσ1 e−t2/2dt=Φ(x).
其中,ηn\eta_nηn可以分解为n个相互独立、服从同一(0-1)分布的诸随机变量X1, X2, …, Xn 之和,即有ηn=∑k=1nXk\eta_n=\sum\limits_{k=1}^{n}X_kηn=k=1∑nXk.
这个定理表明正态分布是二项分布的极限分布