02.第二章抽样分布及若干预备知识(1)

最新推荐文章于 2024-01-01 11:36:09 发布

江景页

最新推荐文章于 2024-01-01 11:36:09 发布

阅读量840

点赞数

CC 4.0 BY-SA版权

分类专栏：《数理统计》学习笔记文章标签：概率论

本文链接：https://blog.youkuaiyun.com/jingye333/article/details/108524270

《数理统计》学习笔记专栏收录该内容

21 篇文章

订阅专栏

本文深入探讨了正态随机变量的线性组合及其统计特性，包括正态分布的线性变换、样本均值与样本方差的分布。通过构造正交矩阵，证明了正态样本均值与方差的独立性，以及样本方差的χ²分布。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第二章抽样分布及若干预备知识(1)

1.正态随机变量的线性组合

正态随机变量的线性组合：设随机变量 $,XnX_1,\cdots,X_n$ 相互独立，且 $Xk∼N(ak,σk2)X_k\sim N(a_k, \sigma_k^2)$ ，有常数 $,cnc_1,\cdots,c_n$ ，记 $T=∑k=1nckXkT=\sum_{k=1}^n c_kX_k$ ，则 $T∼N(μ,τ2),μ=∑k=1nckak,τ2=∑i=1nck2σk2T\sim N(\mu, \tau^2),\mu=\sum_{k=1}^n c_ka_k,\tau^2=\sum_{i=1}^n c_k^2\sigma_k^2$ 。即——独立正态变量的线性组合依然是正态变量。

正态分布的特征函数： $X∼N(a,σ2)X\sim N(a,\sigma^2)$ ，其特征函数为 $fX(t)=eiat−12σ2t2f_X(t)=e^{iat-\frac12\sigma^2t^2}$ 。
特征函数的计算性质：如果 $,XnX_1,\cdots,X_n$ 相互独立，且特征函数分别为 $,fn(t)f_1(t), \cdots, f_n(t)$ ，则 $T=∑k=1nckXkT=\sum_{k=1}^nc_kX_k$ 的特征函数为 $fT(t)=f1(c1t)⋯fn(cnt)f_T(t)=f_1(c_1t)\cdots f_n(c_nt)$ 。

由以上结论可以很直观地得到正态总体样本均值的分布，因为正态总体里的每一个样本都独立同分布于总体，所以对于正态总体 $N(a,σ2)N(a,\sigma^2)$ ，其样本均值 $Xˉ=1n∑k=1nXk∼N(a,σ2n)\bar X=\frac1n\sum_{k=1}^nX_k\sim N(a, \frac{\sigma^2}n)$ 。

正态随机变量的线性变换：现设 $,XnX_1,\cdots, X_n$ 为 $N(a,σ2)N(a,\sigma^2)$ 中简单随机抽取的样本，记 $,Yn)′,A=(aij)n×n\boldsymbol X=(X_1,\cdots, X_n)',\boldsymbol Y=(Y_1,\cdots, Y_n)',\boldsymbol A=(a_{ij})_{n\times n}$ ，满足 $Y=AX\boldsymbol Y=\boldsymbol {AX}$ ，即
$\left( \begin{array}{c} Y_1\\ \vdots \\Y_n \end{array} \right)= \left( \begin{array}{c} a_{11}&\cdots&a_{1n}\\ \vdots& &\vdots\\ a_{n1}&\cdots&a_{nn} \end{array} \right) \left( \begin{array}{c} X_1\\ \vdots \\X_n \end{array} \right)$
这里显然 $Yi=∑k=1naikXkY_i=\sum_{k=1}^n a_{ik}X_k$ ，所以有

$,YnY_1,\cdots,Y_n$ 也是正态随机变量，且 $Yi∼N(a∑k=1naik,σ2∑k=1naik2)Y_i\sim N(a\sum_{k=1}^n a_{ik}, \sigma^2\sum_{k=1}^na_{ik}^2)$ 。
如果 $A\boldsymbol A$ 是正交阵（各行各列都是单位向量且两两正交），则各个 $Y_i$ 的方差都是 $σ2\sigma^2$ ，因为其行向量是单位向量，有 $∑k=1naik2=1\sum_{k=1}^n a_{ik}^2=1$ 。若进一步假定 $a = 0$ ，则各个 $Y_i$ 均服从 $N(0,σ2)N(0,\sigma^2)$ ，这说明正态分布 $N(0,σ2)N(0,\sigma^2)$ 的随机变量经正交变换后依然独立地服从 $N(0,σ2)N(0,\sigma^2)$ （独立性参加下式协方差的值）。
$Cov(Yi,Yj)=Cov(ai1X1+⋯+ainXn,aj1X1+⋯+ajnXn)Cov(Y_i,Y_j)=Cov(a_{i1}X_1+\cdots+a_{in}X_n,a_{j1}X_1+\cdots+a_{jn}X_n)$ ，由于 $,XnX_1,\cdots,X_n$ 之间独立，所以 $Cov(Yi,Yj)=σ2∑k=1naikajkCov(Y_i,Y_j)=\sigma^2\sum_{k=1}^n a_{ik}a_{jk}$ 。

2.正态变量样本均值与样本方差

现讨论正态变量样本均值和方差的分布，设 $,XnX_1,\cdots, X_n$ 简单随机服从 $N(a,σ2)N(a,\sigma^2)$ ，令 $Xˉ=1n∑k=1nXi,S2=1n−1∑k=1n(Xˉ−X)2\bar X=\frac1n\sum_{k=1}^n X_i,S^2=\frac1{n-1}\sum_{k=1}^n(\bar X-X)^2$ 。

首先是 $Xˉ\bar X$ ，由前面的讨论，显然有 $Xˉ∼N(a,σ2n)\bar X\sim N(a, \frac {\sigma^2}n)$ 。

对于 $S^2$ ，有 $(n−1)S2σ2∼χn−12\frac{(n-1)S^2}{\sigma^2} \sim \chi^2_{n-1}$ ，这里 $χn−12\chi^2_{n-1}$ 是指 $n - 1$ 个独立的标准正态随机变量平方和的分布。要证明它，首先需要构造一个正交矩阵 $A\boldsymbol A$ ，且
$\boldsymbol A= \left( \begin{array}{c} \frac1{\sqrt n}&\frac1{\sqrt n}&\cdots&\frac1{\sqrt n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots& &\vdots\\ a_{n1}& a_{n2}&\cdots &a_{nn} \end{array} \right)$
即第一行全都是 $1n\frac1{\sqrt n}$ 的正交阵，可以如此构造：
$\boldsymbol A= \left( \begin{array}{c} \frac1{\sqrt n}&\frac1{\sqrt n}&\frac1{\sqrt n}&\cdots&\frac1{\sqrt n}\\ \frac{1}{\sqrt{2 \cdot 1}}&\frac{-1}{\sqrt{2\cdot 1}}&0&\cdots&0\\ \frac{1}{\sqrt{3\cdot2}}&\frac{1}{\sqrt{3\cdot2}}&\frac{-2}{\sqrt {3\cdot2}}&\cdots&0 \\ \vdots&\vdots& \vdots& &\vdots\\ \frac1{\sqrt{n(n-1)}}& \frac{1}{\sqrt{n(n-1)}}&\frac{1}{\sqrt{n(n-1)}}&\cdots &\frac{-(n-1)}{\sqrt{n(n-1)}} \end{array} \right)$
然后对样本进行正交变换 $Y=AX\boldsymbol{Y=A X}$ ，得到 $Y1=1n∑k=1nXk=nXˉY_1=\frac1{\sqrt n}\sum_{k=1}^n X_k=\sqrt n \bar X$ 。将方差 $S^2$ 进行变形，有
$\begin{array}{l} (n-1)S^2=&\sum_{k=1}^n(X_k-\bar X)^2=\sum_{k=1}^nX_k^2+n\bar X^2-2\bar X\sum_{k=1}^nX_k\\ &\sum_{k=1}^nX_k^2-n\bar X^2 \end{array}$
由于之前证明了 $Y1=nXˉY_1=\sqrt n\bar X$ ，所以 $Y12=nXˉ2Y_1^2=n\bar X^2$ ，又因为正交变换不改变向量的长度，所以 $∑k=1nXk2=∑k=1nYk2\sum_{k=1}^n X_k^2=\sum_{k=1}^n Y_k^2$ ，一代换便得到
$(n-1)S^2=\sum_{k=2}^nY_i^2$
由于刚刚证明了正交变换后，各个 $Y_i$ 的方差依然是 $σ2\sigma^2$ ，如果接下来能够证得 $Y_i$ 的均值是0，协方差是0，就可以得到我们需要的结论。

实际上， $Y_i$ 的均值是 $μi=a∑k=1naik=an∑k=1n1naik\mu_i=a\sum_{k=1}^na_{ik}=a\sqrt n\sum_{k=1}^n \frac1 {\sqrt n}a_{ik}$ ，求和部分内是矩阵 $A\boldsymbol A$ 第一个行向量与第 $i$ 个行向量的内积，由正交性，就得到了 $μi=0\mu_i=0$ 。而任意两个 $Y_i,Y_j$ 间的协方差是 $Cov(Yi,Yj)=σ2∑k=1naikajkCov(Y_i,Y_j)=\sigma^2\sum_{k=1}^n a_{ik}a_{jk}$ ，恰好是第 $i$ 个行向量与第 $j$ 个行向量的内积，因此协方差也为0。

这样，就说明 $,YnY_2,\cdots,Y_n$ 独立地服从 $N(0,σ2)N(0,\sigma^2)$ ，也因此每一个 $Yiσ\frac{Y_i}{\sigma}$ 都独立服从 $N (0, 1)$ ，所以
$(n-1)S^2=\sum_{k=2}^nY_i^2=\sigma^2\sum_{k=2}^n(\frac{Y_i}{\sigma})^2,\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1}$
最后，由于 $Xˉ\bar X$ 只与 $Y_1$ 有关， $S^2$ 只与 $,YnY_2,\cdots,Y_n$ 有关，也就顺便证得了 $Xˉ\bar X$ 与 $S^2$ 独立。