总体与样本
研究对象的全体称为总体,把组成总体的每个成员称为个体
从总体中抽出的部分个体为样本,样本所含的个体称为样品,样本中样品个数称为样本容量
设X是分布函数F(x)的随机变量,若X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是具有同一分布函数F(x)F(x)F(x)的相互独立随机变量,称X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是来自总体X(或分布函数F(x)F(x)F(x)中容量为n的简单随机样本,简称为样本
经验分布函数
x1,...,xnx_1,...,x_nx1,...,xn是来自总体分布函数F(x)的样本,记Ii(x)={1xi≤x0xi>xI_i(x) = \left\{
\begin{aligned}
1& &x_i\le x \\
0 & & x_i > x\\
\end{aligned}
\right.Ii(x)={10xi≤xxi>x
则函数Fn(x)=1n∑i=1nIi(x)F_n(x)=\frac{1}{n}\sum^n_{i=1}I_i(x)Fn(x)=n1i=1∑nIi(x)为经验分布函数
统计量
X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn是某总体样本,若样本函数T=T(X1,X2,...,Xn)T = T(X_1,X_2,...,X_n)T=T(X1,X2,...,Xn)不含任何未知参数,称T为统计量
常用统计量
样本均值
X‾=1n∑i=1nXi\overline{X} = \frac{1}{n}\sum^n_{i=1}X_iX=n1i=1∑nXi
样本方差
S2=1n−1∑i=1n(Xi−X‾)2=1n−1(∑i=1nXi2−nX‾2)S^2=\frac{1}{n-1}\sum^n_{i=1}(X_i-\overline{X})^2=\frac{1}{n-1}(\sum^n_{i=1}X_i^2-n\overline{X}^2)S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX2)
样本标准差
S=S2S = \sqrt{S^2}S=S2
样本k阶原点矩
Ak=1n∑i=1nXikA_k=\frac{1}{n}\sum^n_{i=1}X^k_iAk=n1i=1∑nXik
样本k阶中心距
Bk=1n∑i=1n(Xi−X‾)2B_k=\frac{1}{n}\sum^n_{i=1}(X_i-\overline{X})^2Bk=n1i=1∑n(Xi−X)2
不难发现A1=X‾,B1=0A_1=\overline{X},B_1=0A1=X,B1=0
抽样分布
卡方分布
X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn独立分布且服从标准正态分布N(0,1)N(0,1)N(0,1),则称随机变量χ2=∑i=1nXi2\chi^2=\sum^n_{i=1}X_i^2χ2=∑i=1nXi2服从自由度为n的卡方分布
记为χ2∼χ2(n)∼Ga(n2,12)\chi^2\sim\chi^2(n)\sim Ga(\frac{n}{2},\frac{1}{2})χ2∼χ2(n)∼Ga(2n,21)
不难发现数学期望为n,方差为2n
且卡方分布具有可加性
定理
X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn独立分布且服从标准正态分布N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)
于是有
χ2=∑i=1n(Xi2−μσ)2\chi^2=\sum^n_{i=1}(\frac{X_i^2-\mu}{\sigma})^2χ2=i=1∑n(σXi2−μ)2
t分布
X∼N(0,1) Y∼χ2(n)X\sim N(0,1)~~Y\sim\chi^2(n)X∼N(0,1) Y∼χ2(n) X和Y相互独立
随机变量T=XY/nT = \frac{X}{\sqrt{Y/n}}T=Y/nX满足自由度为n的t分布,记为T∼t(n)T\sim t(n)T∼t(n)
性质
1)T∼t(n)T\sim t(n)T∼t(n),n≤1n\le1n≤1则ET不存在,n >1则ET=0
2)T∼t(n)T\sim t(n)T∼t(n),n >1
E∣T∣k={<∞k<n=∞k≥nE|T|^k= \left\{
\begin{aligned}
<\infty& & k<n \\
=\infty & & k\ge n\\
\end{aligned}
\right.E∣T∣k={<∞=∞k<nk≥n
3)T∼t(n)T\sim t(n)T∼t(n),n>2 VarT=nn−2VarT=\frac{n}{n-2}VarT=n−2n
4)t(1)是柯西分布
5)n充分大可以用标准正态分布来近似
F分布
X∼χ2(n) Y∼χ2(m)X\sim\chi^2(n)~~Y\sim\chi^2(m)X∼χ2(n) Y∼χ2(m)
F=X/NY/MF=\frac{X/N}{Y/M}F=Y/MX/N为自由度为(n,m)的F分布
性质
1)X∼t(n)X\sim t(n)X∼t(n),则X2∼F(1,n)X^2\sim F(1,n)X2∼F(1,n)
2)F∼F(n,m),1/F∼F(m,n)F\sim F(n,m), 1/F\sim F(m,n)F∼F(n,m),1/F∼F(m,n)
3)Fα(n,m)F1−a(m,n)=1F_\alpha(n,m) F_{1-a}(m,n)=1Fα(n,m)F1−a(m,n)=1
正态总体下抽样分布
Fisher定理
X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn独立分布且服从标准正态分布N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2),X‾和S2\overline{X}和S^2X和S2是样本均值和样本方差,则他们独立且
1)
X‾∼N(μ,σ2n)\overline{X}\sim N(\mu,\frac{\sigma^2}{n})X∼N(μ,nσ2)
2)
(n−1)S2σ2∼χ2(n−1)\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)σ2(n−1)S2∼χ2(n−1)
3)
X‾−μSn∼t(n−1)\frac{\overline{X}-\mu}{S}\sqrt{n}\sim t(n-1)SX−μn∼t(n−1)
定理
X1,X2,...,XmX_1,X_2,...,X_mX1,X2,...,Xm独立分布且服从标准正态分布N(μ1,σ12)N(\mu_1,\sigma_1^2)N(μ1,σ12)
Y1,Y2,...,YnY_1,Y_2,...,Y_nY1,Y2,...,Yn独立分布且服从标准正态分布N(μ2,σ22)N(\mu_2,\sigma_2^2)N(μ2,σ22)
X‾=1m∑i=1mXi Y‾=1n∑i=1nYi\overline{X}=\frac{1}{m}\sum^m_{i=1}X_i~~~ \overline{Y}=\frac{1}{n}\sum^n_{i=1}Y_iX=m1i=1∑mXi Y=n1i=1∑nYi
SX2=1m−1∑i=1m(Xi−X‾)2 SY2=1n−1∑i=1n(Yi−Y‾)2S^2_X=\frac{1}{m-1}\sum^m_{i=1}(X_i-\overline{X})^2~~~S^2_Y=\frac{1}{n-1}\sum^n_{i=1}(Y_i-\overline{Y})^2SX2=m−11i=1∑m(Xi−X)2 SY2=n−11i=1∑n(Yi−Y)2
1)
X‾−Y‾∼N(μ1−μ2 , σ12m+σ22n)\overline{X}-\overline{Y}\sim N(\mu_1-\mu_2~,~\frac{\sigma_1^2}{m}+\frac{\sigma^2_2}{n})X−Y∼N(μ1−μ2 , mσ12+nσ22)
2)若σ1=σ2=σ\sigma_1=\sigma_2=\sigmaσ1=σ2=σ
X‾−Y‾−(μ1−μ2)SW1m+1n\frac{\overline{X}-\overline{Y}-(\mu_1-\mu_2)}{S_W\sqrt{\frac{1}{m}+\frac{1}{n}}}SWm1+n1X−Y−(μ1−μ2)
其中
SW2=(m−1)SX2+(N−1)SY2m+n−2S^2_W=\frac{(m-1)S^2_X+(N-1)S^2_Y}{m+n-2}SW2=m+n−2(m−1)SX2+(N−1)SY2
F=SX2/σ12SY2/σ22∼F(m−1,n−1)F= \frac{S^2_X/\sigma_1^2}{S^2_Y/\sigma_2^2}\sim F(m-1,n-1)F=SY2/σ22SX2/σ12∼F(m−1,n−1)
本文介绍了统计学中的基本概念,包括总体、样本、经验分布函数、统计量等,并详细阐述了样本均值、样本方差、样本标准差等常用统计量的计算方法。此外,还介绍了卡方分布、t分布、F分布等重要的抽样分布及其性质。
1417

被折叠的 条评论
为什么被折叠?



