第二章 抽样分布及若干预备知识(1)
1.正态随机变量的线性组合
正态随机变量的线性组合:设随机变量X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn相互独立,且Xk∼N(ak,σk2)X_k\sim N(a_k, \sigma_k^2)Xk∼N(ak,σk2),有常数c1,⋯ ,cnc_1,\cdots,c_nc1,⋯,cn,记T=∑k=1nckXkT=\sum_{k=1}^n c_kX_kT=∑k=1nckXk,则T∼N(μ,τ2),μ=∑k=1nckak,τ2=∑i=1nck2σk2T\sim N(\mu, \tau^2),\mu=\sum_{k=1}^n c_ka_k,\tau^2=\sum_{i=1}^n c_k^2\sigma_k^2T∼N(μ,τ2),μ=∑k=1nckak,τ2=∑i=1nck2σk2。即——独立正态变量的线性组合依然是正态变量。
- 正态分布的特征函数:X∼N(a,σ2)X\sim N(a,\sigma^2)X∼N(a,σ2),其特征函数为fX(t)=eiat−12σ2t2f_X(t)=e^{iat-\frac12\sigma^2t^2}fX(t)=eiat−21σ2t2。
- 特征函数的计算性质:如果X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn相互独立,且特征函数分别为f1(t),⋯ ,fn(t)f_1(t), \cdots, f_n(t)f1(t),⋯,fn(t),则T=∑k=1nckXkT=\sum_{k=1}^nc_kX_kT=∑k=1nckXk的特征函数为fT(t)=f1(c1t)⋯fn(cnt)f_T(t)=f_1(c_1t)\cdots f_n(c_nt)fT(t)=f1(c1t)⋯fn(cnt)。
由以上结论可以很直观地得到正态总体样本均值的分布,因为正态总体里的每一个样本都独立同分布于总体,所以对于正态总体N(a,σ2)N(a,\sigma^2)N(a,σ2),其样本均值Xˉ=1n∑k=1nXk∼N(a,σ2n)\bar X=\frac1n\sum_{k=1}^nX_k\sim N(a, \frac{\sigma^2}n)Xˉ=n1∑k=1nXk∼N(a,nσ2)。
正态随机变量的线性变换:现设X1,⋯ ,XnX_1,\cdots, X_nX1,⋯,Xn为N(a,σ2)N(a,\sigma^2)N(a,σ2)中简单随机抽取的样本,记X=(X1,⋯ ,Xn)′,Y=(Y1,⋯ ,Yn)′,A=(aij)n×n\boldsymbol X=(X_1,\cdots, X_n)',\boldsymbol Y=(Y_1,\cdots, Y_n)',\boldsymbol A=(a_{ij})_{n\times n}X=(X1,⋯,Xn)′,Y=(Y1,⋯,Yn)′,A=(aij)n×n,满足Y=AX\boldsymbol Y=\boldsymbol {AX}Y=AX,即
(Y1⋮Yn)=(a11⋯a1n⋮⋮an1⋯ann)(X1⋮Xn)
\left(
\begin{array}{c}
Y_1\\ \vdots \\Y_n
\end{array}
\right)=
\left(
\begin{array}{c}
a_{11}&\cdots&a_{1n}\\
\vdots& &\vdots\\
a_{n1}&\cdots&a_{nn}
\end{array}
\right)
\left(
\begin{array}{c}
X_1\\ \vdots \\X_n
\end{array}
\right)
⎝⎜⎛Y1⋮Yn⎠⎟⎞=⎝⎜⎛a11⋮an1⋯⋯a1n⋮ann⎠⎟⎞⎝⎜⎛X1⋮Xn⎠⎟⎞
这里显然Yi=∑k=1naikXkY_i=\sum_{k=1}^n a_{ik}X_kYi=∑k=1naikXk,所以有
- Y1,⋯ ,YnY_1,\cdots,Y_nY1,⋯,Yn也是正态随机变量,且Yi∼N(a∑k=1naik,σ2∑k=1naik2)Y_i\sim N(a\sum_{k=1}^n a_{ik}, \sigma^2\sum_{k=1}^na_{ik}^2)Yi∼N(a∑k=1naik,σ2∑k=1naik2)。
- 如果A\boldsymbol AA是正交阵(各行各列都是单位向量且两两正交),则各个YiY_iYi的方差都是σ2\sigma^2σ2,因为其行向量是单位向量,有∑k=1naik2=1\sum_{k=1}^n a_{ik}^2=1∑k=1naik2=1。若进一步假定a=0a=0a=0,则各个YiY_iYi均服从N(0,σ2)N(0,\sigma^2)N(0,σ2),这说明正态分布N(0,σ2)N(0,\sigma^2)N(0,σ2)的随机变量经正交变换后依然独立地服从N(0,σ2)N(0,\sigma^2)N(0,σ2)(独立性参加下式协方差的值)。
- Cov(Yi,Yj)=Cov(ai1X1+⋯+ainXn,aj1X1+⋯+ajnXn)Cov(Y_i,Y_j)=Cov(a_{i1}X_1+\cdots+a_{in}X_n,a_{j1}X_1+\cdots+a_{jn}X_n)Cov(Yi,Yj)=Cov(ai1X1+⋯+ainXn,aj1X1+⋯+ajnXn),由于X1,⋯ ,XnX_1,\cdots,X_nX1,⋯,Xn之间独立,所以Cov(Yi,Yj)=σ2∑k=1naikajkCov(Y_i,Y_j)=\sigma^2\sum_{k=1}^n a_{ik}a_{jk}Cov(Yi,Yj)=σ2∑k=1naikajk。
2.正态变量样本均值与样本方差
现讨论正态变量样本均值和方差的分布,设X1,⋯ ,XnX_1,\cdots, X_nX1,⋯,Xn简单随机服从N(a,σ2)N(a,\sigma^2)N(a,σ2),令Xˉ=1n∑k=1nXi,S2=1n−1∑k=1n(Xˉ−X)2\bar X=\frac1n\sum_{k=1}^n X_i,S^2=\frac1{n-1}\sum_{k=1}^n(\bar X-X)^2Xˉ=n1∑k=1nXi,S2=n−11∑k=1n(Xˉ−X)2。
首先是Xˉ\bar XXˉ,由前面的讨论,显然有Xˉ∼N(a,σ2n)\bar X\sim N(a, \frac {\sigma^2}n)Xˉ∼N(a,nσ2)。
对于S2S^2S2,有(n−1)S2σ2∼χn−12\frac{(n-1)S^2}{\sigma^2} \sim \chi^2_{n-1}σ2(n−1)S2∼χn−12,这里χn−12\chi^2_{n-1}χn−12是指n−1n-1n−1个独立的标准正态随机变量平方和的分布。要证明它,首先需要构造一个正交矩阵A\boldsymbol AA,且
A=(1n1n⋯1na21a22⋯a2n⋮⋮⋮an1an2⋯ann)
\boldsymbol A=
\left(
\begin{array}{c}
\frac1{\sqrt n}&\frac1{\sqrt n}&\cdots&\frac1{\sqrt n}\\
a_{21}&a_{22}&\cdots&a_{2n}\\
\vdots&\vdots& &\vdots\\
a_{n1}& a_{n2}&\cdots &a_{nn}
\end{array}
\right)
A=⎝⎜⎜⎜⎛n1a21⋮an1n1a22⋮an2⋯⋯⋯n1a2n⋮ann⎠⎟⎟⎟⎞
即第一行全都是1n\frac1{\sqrt n}n1的正交阵,可以如此构造:
A=(1n1n1n⋯1n12⋅1−12⋅10⋯013⋅213⋅2−23⋅2⋯0⋮⋮⋮⋮1n(n−1)1n(n−1)1n(n−1)⋯−(n−1)n(n−1))
\boldsymbol A=
\left(
\begin{array}{c}
\frac1{\sqrt n}&\frac1{\sqrt n}&\frac1{\sqrt n}&\cdots&\frac1{\sqrt n}\\
\frac{1}{\sqrt{2 \cdot 1}}&\frac{-1}{\sqrt{2\cdot 1}}&0&\cdots&0\\
\frac{1}{\sqrt{3\cdot2}}&\frac{1}{\sqrt{3\cdot2}}&\frac{-2}{\sqrt {3\cdot2}}&\cdots&0
\\
\vdots&\vdots& \vdots& &\vdots\\
\frac1{\sqrt{n(n-1)}}& \frac{1}{\sqrt{n(n-1)}}&\frac{1}{\sqrt{n(n-1)}}&\cdots &\frac{-(n-1)}{\sqrt{n(n-1)}}
\end{array}
\right)
A=⎝⎜⎜⎜⎜⎜⎜⎜⎛n12⋅113⋅21⋮n(n−1)1n12⋅1−13⋅21⋮n(n−1)1n103⋅2−2⋮n(n−1)1⋯⋯⋯⋯n100⋮n(n−1)−(n−1)⎠⎟⎟⎟⎟⎟⎟⎟⎞
然后对样本进行正交变换Y=AX\boldsymbol{Y=A X}Y=AX,得到Y1=1n∑k=1nXk=nXˉY_1=\frac1{\sqrt n}\sum_{k=1}^n X_k=\sqrt n \bar XY1=n1∑k=1nXk=nXˉ。将方差S2S^2S2进行变形,有
(n−1)S2=∑k=1n(Xk−Xˉ)2=∑k=1nXk2+nXˉ2−2Xˉ∑k=1nXk∑k=1nXk2−nXˉ2
\begin{array}{l}
(n-1)S^2=&\sum_{k=1}^n(X_k-\bar X)^2=\sum_{k=1}^nX_k^2+n\bar X^2-2\bar X\sum_{k=1}^nX_k\\
&\sum_{k=1}^nX_k^2-n\bar X^2
\end{array}
(n−1)S2=∑k=1n(Xk−Xˉ)2=∑k=1nXk2+nXˉ2−2Xˉ∑k=1nXk∑k=1nXk2−nXˉ2
由于之前证明了Y1=nXˉY_1=\sqrt n\bar XY1=nXˉ,所以Y12=nXˉ2Y_1^2=n\bar X^2Y12=nXˉ2,又因为正交变换不改变向量的长度,所以∑k=1nXk2=∑k=1nYk2\sum_{k=1}^n X_k^2=\sum_{k=1}^n Y_k^2∑k=1nXk2=∑k=1nYk2,一代换便得到
(n−1)S2=∑k=2nYi2
(n-1)S^2=\sum_{k=2}^nY_i^2
(n−1)S2=k=2∑nYi2
由于刚刚证明了正交变换后,各个YiY_iYi的方差依然是σ2\sigma^2σ2,如果接下来能够证得YiY_iYi的均值是0,协方差是0,就可以得到我们需要的结论。
实际上,YiY_iYi的均值是μi=a∑k=1naik=an∑k=1n1naik\mu_i=a\sum_{k=1}^na_{ik}=a\sqrt n\sum_{k=1}^n \frac1 {\sqrt n}a_{ik}μi=a∑k=1naik=an∑k=1nn1aik,求和部分内是矩阵A\boldsymbol AA第一个行向量与第iii个行向量的内积,由正交性,就得到了μi=0\mu_i=0μi=0。而任意两个Yi,YjY_i,Y_jYi,Yj间的协方差是Cov(Yi,Yj)=σ2∑k=1naikajkCov(Y_i,Y_j)=\sigma^2\sum_{k=1}^n a_{ik}a_{jk}Cov(Yi,Yj)=σ2∑k=1naikajk,恰好是第iii个行向量与第jjj个行向量的内积,因此协方差也为0。
这样,就说明Y2,⋯ ,YnY_2,\cdots,Y_nY2,⋯,Yn独立地服从N(0,σ2)N(0,\sigma^2)N(0,σ2),也因此每一个Yiσ\frac{Y_i}{\sigma}σYi都独立服从N(0,1)N(0,1)N(0,1),所以
(n−1)S2=∑k=2nYi2=σ2∑k=2n(Yiσ)2,(n−1)S2σ2∼χn−12
(n-1)S^2=\sum_{k=2}^nY_i^2=\sigma^2\sum_{k=2}^n(\frac{Y_i}{\sigma})^2,\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1}
(n−1)S2=k=2∑nYi2=σ2k=2∑n(σYi)2,σ2(n−1)S2∼χn−12
最后,由于Xˉ\bar XXˉ只与Y1Y_1Y1有关,S2S^2S2只与Y2,⋯ ,YnY_2,\cdots,Y_nY2,⋯,Yn有关,也就顺便证得了Xˉ\bar XXˉ与S2S^2S2独立。