1. 独立同分布的中心极限定理
-
定理
设随机变量 X 1 , X 2 , X 3 , ⋯ , X n , ⋯ X_1,X_2,X_3,\cdots,X_n,\cdots X1,X2,X3,⋯,Xn,⋯ ,相互独立,服从同一分布,且具有数学期望和方差 E ( X k ) = μ E(X_k)=\mu E(Xk)=μ , D ( X k ) = σ 2 > 0 D(X_k)=\sigma^2 >0 D(Xk)=σ2>0 ( k = 1 , 2 , 3 , ⋯ ) (k=1,2,3,\cdots) (k=1,2,3,⋯),则随机变量之和 ∑ k = 1 n X k \sum\limits_{k=1}^nX_k k=1∑nXk 的标准化变量, Y n = ∑ k = 1 n X k − E ( ∑ k = 1 n X k ) D ( ∑ k = 1 n X k ) = ∑ k = 1 n X k − n μ n σ Y_n=\frac{\sum\limits_{k=1}^nX_k-E(\sum\limits_{k=1}^nX_k)}{\sqrt{D(\sum\limits_{k=1}^nX_k)}} = \frac{\sum\limits_{k=1}^nX_k-n\mu}{\sqrt{n}\sigma} Yn=D(k=1∑nXk)k=1∑nXk−E(k=1∑nXk)=nσk=1∑nXk−nμ 的分布函数 F n ( x ) F_n(x) Fn(x) 对于任意 x x x满足 lim n → ∞ F n ( x ) = lim n → ∞ P { ∑ k = 1 n X k − n μ n σ ≤ x } = ∫ − ∞ x 1 2 π e − t 2 / 2 d t = Φ ( x ) \begin{aligned}\lim\limits_{n\to \infty}F_n(x) = \lim\limits_{n\to \infty}P\bigg\{\frac{\sum\limits_{k=1}^nX_k-n\mu}{\sqrt{n}\sigma}\leq x\bigg\} = \int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dt=\Phi(x) \end{aligned} n→∞limFn(x)=n→∞limP{nσk=1∑nXk−nμ≤x}=∫−∞x2π1e−t2/2dt=Φ(x)
-
理解
从定理可知,期望为 μ \mu μ,方差为 σ 2 \sigma^2 σ2的独立同分布随机变量序列 X 1 , X 2 , X 3 , ⋯ , X n , ⋯ X_1,X_2,X_3,\cdots,X_n,\cdots X1,X2,X3,⋯,Xn,⋯之和 ∑ k = 1 n X k \sum\limits_{k=1}^nX_k k=1∑nXk的标准化变量,当 n n n足够大时,近似服从标准正态分布,即 ∑ k = 1 n X k − n μ n σ ∼ N ( 0 , 1 ) \frac{\sum\limits_{k=1}^nX_k-n\mu}{\sqrt{n}\sigma}\sim N(0,1) nσk=1∑nXk−nμ∼N(0,1) 由于 ∑ k = 1 n X k − n μ n σ = 1 n ∑ k = 1 n X k − μ σ / n = X ‾ − μ σ / n \frac{\sum\limits_{k=1}^nX_k-n\mu}{\sqrt{n}\sigma}=\frac{\frac{1}{n}\sum\limits_{k=1}^nX_k-\mu}{\sigma/\sqrt{n}}=\frac{\overline X-\mu}{\sigma/\sqrt{n}} nσk=1∑nXk−nμ=σ/nn1k=1∑nXk−μ=σ/nX−μ 因此有 X ‾ − μ σ / n ∼ N ( 0 , 1 ) 或 X ‾ ∼ N ( μ , σ 2 / n ) , \frac{\overline X-\mu}{\sigma/\sqrt{n}}\sim N(0,1) \quad 或 \overline X \sim N(\mu,\sigma^2/n), σ/nX−μ∼N(0,1)或X∼N(μ,σ2/n), 这是独立同分布的中心极限定理结果的另一个形式。
2. 棣莫弗-拉普拉斯(De Moivre-Laplace)定理
-
定理
设随机变量 η n ( n = 1 , 2 , ⋯ ) \eta_n(n=1,2,\cdots) ηn(n=1,2,⋯)服从参数为 n , p ( 0 < p < 1 ) n,p \quad(0<p<1) n,p(0<p<1) 的二项分布,则对于任意 x x x,有 lim n → ∞ P { η n − n p n p ( 1 − p ) ≤ x } = ∫ − ∞ x 1 2 π e − t 2 / 2 d t = Φ ( x ) . \begin{aligned}\lim\limits_{n\to\infty}P\bigg\{\frac{\eta_n-np}{\sqrt{np(1-p)}}\leq x\bigg\}=\int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dt=\Phi(x)\end{aligned}. n→∞limP{np(1−p)ηn−np≤x}=∫−∞x2π1e−t2/2dt=Φ(x).
证明
二项分布可以看做是 n n n个相互独立且服从同一 ( 0 − 1 ) (0-1) (0−1)分布的随机变量 X 1 , X 2 , X 3 , ⋯ , X n X_1,X_2,X_3,\cdots,X_n X1,X2,X3,⋯,Xn之和,此时有 η n = ∑ i = 1 n X k , \eta_n=\sum\limits_{i=1}^{n} X_k, ηn=i=1∑nXk, 其中 X k ( k = 1 , 2 , ⋯ , n ) X_k\quad (k=1,2,\cdots,n) Xk(k=1,2,⋯,n)的分布律为 P { X k = i } = p i ( 1 − p ) 1 − i , i = 0 , 1 P\{X_k=i\}=p^i(1-p)^{1-i},i=0,1 P{Xk=i}=pi(1−p)1−i,i=0,1 我们知道 E ( X k ) = p , D ( X k ) = p ( 1 − p ) E(X_k) = p,D(X_k)=p(1-p) E(Xk)=p,D(Xk)=p(1−p) ,很明显,根据独立同分布的中心极限定理可知,有 lim n → ∞ P { η n − n p n p ( 1 − p ) ≤ x } = ∫ − ∞ x 1 2 π e − t 2 / 2 d t = Φ ( x ) . \begin{aligned}\lim\limits_{n\to\infty}P\bigg\{\frac{\eta_n-np}{\sqrt{np(1-p)}}\leq x\bigg\}=\int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dt=\Phi(x)\end{aligned}. n→∞limP{np(1−p)ηn−np≤x}=∫−∞x2π1e−t2/2dt=Φ(x).
-
该定理为独立同分布的中心极限定理的特殊情况。该定理表明,正态分布是二项分布的极限分布,当 n n n足够大时,可以用正态分布近似计算二项分布。
3. 李雅普诺夫(Lyapunov)定理
-
定理
设随机变量 X 1 , X 2 , X 3 , ⋯ , X n , ⋯ X_1,X_2,X_3,\cdots,X_n,\cdots X1,X2,X3,⋯,Xn,⋯ ,相互独立,他们具有数学期望和方差 E ( X k ) = μ k , D ( X k ) = σ k 2 > 0 k = 1 , 2 , 3 , ⋯ E(X_k)=\mu_k ,D(X_k)=\sigma_k^2>0 \quad k =1,2,3,\cdots E(Xk)=μk,D(Xk)=σk2>0k=1,2,3,⋯ 记 B n 2 = ∑ k = 1 n σ k 2 B_n^2=\sum\limits_{k=1}^n\sigma_k^2 Bn2=k=1∑nσk2 若存在正数 δ \delta δ ,使得当 n → ∞ n\to\infty n→∞ 时, 1 B n 2 + δ ∑ k = 1 n E { ∣ X − μ k ∣ 2 + δ } → 0 , \frac{1}{B_n^{2+\delta}}\sum\limits_{k=1}^{n}E\{|X-\mu_k|^{2+\delta}\}\to0, Bn2+δ1k=1∑nE{∣X−μk∣2+δ}→0,则随机变量之和 ∑ k = 1 n X k \sum\limits_{k=1}^nX_k k=1∑nXk的标准化变量 Z n = ∑ k = 1 n X k − E ( ∑ k = 1 n X k ) D ( ∑ k = 1 n X k ) = ∑ k = 1 n X k − ∑ k = 1 n μ k B n Z_n=\frac{\sum\limits_{k=1}^nX_k-E(\sum\limits_{k=1}^nX_k)}{\sqrt{D(\sum\limits_{k=1}^nX_k)}} = \frac{\sum\limits_{k=1}^nX_k-\sum\limits_{k=1}^n\mu_k}{B_n} Zn=D(k=1∑nXk)k=1∑nXk−E(k=1∑nXk)=Bnk=1∑nXk−k=1∑nμk 的分布函数 F n ( x ) F_n(x) Fn(x) 对于任意 x x x,满足 lim n → ∞ F n ( x ) = lim n → ∞ P { ∑ k = 1 n X k − ∑ k = 1 n μ k B n ≤ x } = ∫ − ∞ x 1 2 π e − t 2 / 2 d t = Φ ( x ) \begin{aligned}\lim\limits_{n\to \infty}F_n(x) = \lim\limits_{n\to \infty}P\bigg\{\frac{\sum\limits_{k=1}^nX_k-\sum\limits_{k=1}^n\mu_k}{B_n}\leq x\bigg\} = \int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-t^2/2}dt=\Phi(x)\end{aligned} n→∞limFn(x)=n→∞limP{Bnk=1∑nXk−k=1∑nμk≤x}=∫−∞x2π1e−t2/2dt=Φ(x)
-
理解
该定理表明,在定理条件下,随机变量 Z n = ∑ k = 1 n X k − ∑ k = 1 n μ k B n Z_n= \frac{\sum\limits_{k=1}^nX_k-\sum\limits_{k=1}^n\mu_k}{B_n} Zn=Bnk=1∑nXk−k=1∑nμk 当 n n n很大时,近似的服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),由此可知, 当 n n n很大时, ∑ k = 1 n X k \sum\limits_{k=1}^nX_k k=1∑nXk 近似的服从正态分布 N ( ∑ k = 1 n μ k , B n 2 ) N(\sum\limits_{k=1}^n\mu_k,B_n^2) N(k=1∑nμk,Bn2) ,该定理只要求随机变量 X 1 , X 2 , X 3 , ⋯ , X n , ⋯ X_1,X_2,X_3,\cdots,X_n,\cdots X1,X2,X3,⋯,Xn,⋯ 相互独立,并没有要求服从什么分布,也就是说,无论各个随机变量服从什么分布,只要满足定理的条件,那么他们的和 ∑ k = 1 n X k \sum\limits_{k=1}^nX_k k=1∑nXk 当 n n n很大时,就近似地服从正态分布,这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因。