02.第二章 抽样分布及若干预备知识(1)

本文深入探讨了正态随机变量的线性组合及其统计特性,包括正态分布的线性变换、样本均值与样本方差的分布。通过构造正交矩阵,证明了正态样本均值与方差的独立性,以及样本方差的χ²分布。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第二章 抽样分布及若干预备知识(1)

1.正态随机变量的线性组合

正态随机变量的线性组合:设随机变量X1,⋯ ,XnX_1,\cdots,X_nX1,,Xn相互独立,且Xk∼N(ak,σk2)X_k\sim N(a_k, \sigma_k^2)XkN(ak,σk2),有常数c1,⋯ ,cnc_1,\cdots,c_nc1,,cn,记T=∑k=1nckXkT=\sum_{k=1}^n c_kX_kT=k=1nckXk,则T∼N(μ,τ2),μ=∑k=1nckak,τ2=∑i=1nck2σk2T\sim N(\mu, \tau^2),\mu=\sum_{k=1}^n c_ka_k,\tau^2=\sum_{i=1}^n c_k^2\sigma_k^2TN(μ,τ2),μ=k=1nckak,τ2=i=1nck2σk2。即——独立正态变量的线性组合依然是正态变量。

  • 正态分布的特征函数:X∼N(a,σ2)X\sim N(a,\sigma^2)XN(a,σ2),其特征函数为fX(t)=eiat−12σ2t2f_X(t)=e^{iat-\frac12\sigma^2t^2}fX(t)=eiat21σ2t2
  • 特征函数的计算性质:如果X1,⋯ ,XnX_1,\cdots,X_nX1,,Xn相互独立,且特征函数分别为f1(t),⋯ ,fn(t)f_1(t), \cdots, f_n(t)f1(t),,fn(t),则T=∑k=1nckXkT=\sum_{k=1}^nc_kX_kT=k=1nckXk的特征函数为fT(t)=f1(c1t)⋯fn(cnt)f_T(t)=f_1(c_1t)\cdots f_n(c_nt)fT(t)=f1(c1t)fn(cnt)

由以上结论可以很直观地得到正态总体样本均值的分布,因为正态总体里的每一个样本都独立同分布于总体,所以对于正态总体N(a,σ2)N(a,\sigma^2)N(a,σ2),其样本均值Xˉ=1n∑k=1nXk∼N(a,σ2n)\bar X=\frac1n\sum_{k=1}^nX_k\sim N(a, \frac{\sigma^2}n)Xˉ=n1k=1nXkN(a,nσ2)


正态随机变量的线性变换:现设X1,⋯ ,XnX_1,\cdots, X_nX1,,XnN(a,σ2)N(a,\sigma^2)N(a,σ2)中简单随机抽取的样本,记X=(X1,⋯ ,Xn)′,Y=(Y1,⋯ ,Yn)′,A=(aij)n×n\boldsymbol X=(X_1,\cdots, X_n)',\boldsymbol Y=(Y_1,\cdots, Y_n)',\boldsymbol A=(a_{ij})_{n\times n}X=(X1,,Xn),Y=(Y1,,Yn),A=(aij)n×n,满足Y=AX\boldsymbol Y=\boldsymbol {AX}Y=AX,即
(Y1⋮Yn)=(a11⋯a1n⋮⋮an1⋯ann)(X1⋮Xn) \left( \begin{array}{c} Y_1\\ \vdots \\Y_n \end{array} \right)= \left( \begin{array}{c} a_{11}&\cdots&a_{1n}\\ \vdots& &\vdots\\ a_{n1}&\cdots&a_{nn} \end{array} \right) \left( \begin{array}{c} X_1\\ \vdots \\X_n \end{array} \right) Y1Yn=a11an1a1nannX1Xn
这里显然Yi=∑k=1naikXkY_i=\sum_{k=1}^n a_{ik}X_kYi=k=1naikXk,所以有

  • Y1,⋯ ,YnY_1,\cdots,Y_nY1,,Yn也是正态随机变量,且Yi∼N(a∑k=1naik,σ2∑k=1naik2)Y_i\sim N(a\sum_{k=1}^n a_{ik}, \sigma^2\sum_{k=1}^na_{ik}^2)YiN(ak=1naik,σ2k=1naik2)
  • 如果A\boldsymbol AA是正交阵(各行各列都是单位向量且两两正交),则各个YiY_iYi的方差都是σ2\sigma^2σ2,因为其行向量是单位向量,有∑k=1naik2=1\sum_{k=1}^n a_{ik}^2=1k=1naik2=1。若进一步假定a=0a=0a=0,则各个YiY_iYi均服从N(0,σ2)N(0,\sigma^2)N(0,σ2),这说明正态分布N(0,σ2)N(0,\sigma^2)N(0,σ2)的随机变量经正交变换后依然独立地服从N(0,σ2)N(0,\sigma^2)N(0,σ2)(独立性参加下式协方差的值)。
  • Cov(Yi,Yj)=Cov(ai1X1+⋯+ainXn,aj1X1+⋯+ajnXn)Cov(Y_i,Y_j)=Cov(a_{i1}X_1+\cdots+a_{in}X_n,a_{j1}X_1+\cdots+a_{jn}X_n)Cov(Yi,Yj)=Cov(ai1X1++ainXn,aj1X1++ajnXn),由于X1,⋯ ,XnX_1,\cdots,X_nX1,,Xn之间独立,所以Cov(Yi,Yj)=σ2∑k=1naikajkCov(Y_i,Y_j)=\sigma^2\sum_{k=1}^n a_{ik}a_{jk}Cov(Yi,Yj)=σ2k=1naikajk

2.正态变量样本均值与样本方差

现讨论正态变量样本均值和方差的分布,设X1,⋯ ,XnX_1,\cdots, X_nX1,,Xn简单随机服从N(a,σ2)N(a,\sigma^2)N(a,σ2),令Xˉ=1n∑k=1nXi,S2=1n−1∑k=1n(Xˉ−X)2\bar X=\frac1n\sum_{k=1}^n X_i,S^2=\frac1{n-1}\sum_{k=1}^n(\bar X-X)^2Xˉ=n1k=1nXi,S2=n11k=1n(XˉX)2

首先是Xˉ\bar XXˉ,由前面的讨论,显然有Xˉ∼N(a,σ2n)\bar X\sim N(a, \frac {\sigma^2}n)XˉN(a,nσ2)

对于S2S^2S2,有(n−1)S2σ2∼χn−12\frac{(n-1)S^2}{\sigma^2} \sim \chi^2_{n-1}σ2(n1)S2χn12,这里χn−12\chi^2_{n-1}χn12是指n−1n-1n1个独立的标准正态随机变量平方和的分布。要证明它,首先需要构造一个正交矩阵A\boldsymbol AA,且
A=(1n1n⋯1na21a22⋯a2n⋮⋮⋮an1an2⋯ann) \boldsymbol A= \left( \begin{array}{c} \frac1{\sqrt n}&\frac1{\sqrt n}&\cdots&\frac1{\sqrt n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots& &\vdots\\ a_{n1}& a_{n2}&\cdots &a_{nn} \end{array} \right) A=n1a21an1n1a22an2n1a2nann
即第一行全都是1n\frac1{\sqrt n}n1的正交阵,可以如此构造:
A=(1n1n1n⋯1n12⋅1−12⋅10⋯013⋅213⋅2−23⋅2⋯0⋮⋮⋮⋮1n(n−1)1n(n−1)1n(n−1)⋯−(n−1)n(n−1)) \boldsymbol A= \left( \begin{array}{c} \frac1{\sqrt n}&\frac1{\sqrt n}&\frac1{\sqrt n}&\cdots&\frac1{\sqrt n}\\ \frac{1}{\sqrt{2 \cdot 1}}&\frac{-1}{\sqrt{2\cdot 1}}&0&\cdots&0\\ \frac{1}{\sqrt{3\cdot2}}&\frac{1}{\sqrt{3\cdot2}}&\frac{-2}{\sqrt {3\cdot2}}&\cdots&0 \\ \vdots&\vdots& \vdots& &\vdots\\ \frac1{\sqrt{n(n-1)}}& \frac{1}{\sqrt{n(n-1)}}&\frac{1}{\sqrt{n(n-1)}}&\cdots &\frac{-(n-1)}{\sqrt{n(n-1)}} \end{array} \right) A=n1211321n(n1)1n1211321n(n1)1n10322n(n1)1n100n(n1)(n1)
然后对样本进行正交变换Y=AX\boldsymbol{Y=A X}Y=AX,得到Y1=1n∑k=1nXk=nXˉY_1=\frac1{\sqrt n}\sum_{k=1}^n X_k=\sqrt n \bar XY1=n1k=1nXk=nXˉ。将方差S2S^2S2进行变形,有
(n−1)S2=∑k=1n(Xk−Xˉ)2=∑k=1nXk2+nXˉ2−2Xˉ∑k=1nXk∑k=1nXk2−nXˉ2 \begin{array}{l} (n-1)S^2=&\sum_{k=1}^n(X_k-\bar X)^2=\sum_{k=1}^nX_k^2+n\bar X^2-2\bar X\sum_{k=1}^nX_k\\ &\sum_{k=1}^nX_k^2-n\bar X^2 \end{array} (n1)S2=k=1n(XkXˉ)2=k=1nXk2+nXˉ22Xˉk=1nXkk=1nXk2nXˉ2
由于之前证明了Y1=nXˉY_1=\sqrt n\bar XY1=nXˉ,所以Y12=nXˉ2Y_1^2=n\bar X^2Y12=nXˉ2,又因为正交变换不改变向量的长度,所以∑k=1nXk2=∑k=1nYk2\sum_{k=1}^n X_k^2=\sum_{k=1}^n Y_k^2k=1nXk2=k=1nYk2,一代换便得到
(n−1)S2=∑k=2nYi2 (n-1)S^2=\sum_{k=2}^nY_i^2 (n1)S2=k=2nYi2
由于刚刚证明了正交变换后,各个YiY_iYi的方差依然是σ2\sigma^2σ2,如果接下来能够证得YiY_iYi的均值是0,协方差是0,就可以得到我们需要的结论。

实际上,YiY_iYi的均值是μi=a∑k=1naik=an∑k=1n1naik\mu_i=a\sum_{k=1}^na_{ik}=a\sqrt n\sum_{k=1}^n \frac1 {\sqrt n}a_{ik}μi=ak=1naik=ank=1nn1aik,求和部分内是矩阵A\boldsymbol AA第一个行向量与第iii个行向量的内积,由正交性,就得到了μi=0\mu_i=0μi=0。而任意两个Yi,YjY_i,Y_jYi,Yj间的协方差是Cov(Yi,Yj)=σ2∑k=1naikajkCov(Y_i,Y_j)=\sigma^2\sum_{k=1}^n a_{ik}a_{jk}Cov(Yi,Yj)=σ2k=1naikajk,恰好是第iii个行向量与第jjj个行向量的内积,因此协方差也为0。

这样,就说明Y2,⋯ ,YnY_2,\cdots,Y_nY2,,Yn独立地服从N(0,σ2)N(0,\sigma^2)N(0,σ2),也因此每一个Yiσ\frac{Y_i}{\sigma}σYi都独立服从N(0,1)N(0,1)N(0,1),所以
(n−1)S2=∑k=2nYi2=σ2∑k=2n(Yiσ)2,(n−1)S2σ2∼χn−12 (n-1)S^2=\sum_{k=2}^nY_i^2=\sigma^2\sum_{k=2}^n(\frac{Y_i}{\sigma})^2,\frac{(n-1)S^2}{\sigma^2}\sim \chi^2_{n-1} (n1)S2=k=2nYi2=σ2k=2n(σYi)2,σ2(n1)S2χn12
最后,由于Xˉ\bar XXˉ只与Y1Y_1Y1有关,S2S^2S2只与Y2,⋯ ,YnY_2,\cdots,Y_nY2,,Yn有关,也就顺便证得了Xˉ\bar XXˉS2S^2S2独立。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值