第六章 样本及抽样分布
在概率中,我们所研究的随机变量的分布都是假设已知的。
在数理统计中,我们研究的随机变量的分布是未知的,或者是不完全知道的。我们通过对随机变量进行大量重复、独立的观察,收集书记,然后对数据进行整理,分析,从而对所研究的随机变量的分布作出各种推断。
随机样本
总体与个体
在数理统计中,我们把研究的对象的全体称为总体总体,总体中的每个成员称个体个体
在实际问题中,我们只对总体的某些数量指标感兴趣。这时,我们就把这些数量指标(如人的体重,学生的成绩)的全体作为总体总体,把每个数值作为个体个体。
总体中包含的个体的数量称为总体的容量容量。
容量为有限的总体称为有限总体有限总体,
容量为无限的总体称为无限总体无限总体,
若有限总体容量很大,可以视为无线总体。
总体中的每一个个体是随机试验的一个观察值x,它是某个随机变量X的取值。
例如总体是一群人的身高,身高X是一个随机变量,每个身高x是X的一个取值。
这样,一个总体对应一个随机变量X。
我们对总体的研究就是对这个随机变量X的研究。
X的分布函数和树脂2特征就称为总体的分布函数和数字特征。
进货我们将不区分总体与相应的随机变量,统称为总体X。
随机样本
从总体X中抽得的一部分个体叫做总体的一个样本。
从总体抽取一个个体,就是对总体X进行一次观察并记录结果。
我们在相同条件下对总体X进行n次反复独立的观察,并将n次观察结果按试验次序记为X1,…,Xn。由于每次观察结果也是随机的,因此这些Xi都是随机变量。
X1,…Xn是相互独立的,有与X相同分布的随机变量(独立同分布
)
从总体X中抽得n个个体X1,…,Xn称来自总体X的容量为n的样本样本,而每个个体Xi称为一个样本点样本点。
它们依次是X1,…,Xn的样本观察值,简称样本值样本值。
简单随机抽样
从总体中抽取样本必须满足一下两个条件:
1.随机性:抽样应随机进行,使得每个个体被抽到的机会均等。
2.独立性:每次抽样应独立惊喜,结果不受其他抽样结果影响,也不影响其他抽样结果。
满足以上两个条件抽样称为简单随机抽样。
对于有限总体,采用有放回抽样。
对应无线总体或大容量总体,采用不放回抽样。
后面提到抽样都是假设简单随机抽样。
总体,个体,简单随机抽样是数理统计中三个最基本的概念。
简单随机变量具有独立性和代表性(同分布)两个特征。
样本的分布函数和密度函数
设总体X是具有分布函数F的随机变量,若X1,…,Xn是X的一个容量为n的简单随机样本,则X1,…,Xn是具有同一分布函数F,且相互独立的随机变量。
我们也称X1,…,Xn为从分布函数F得到的容量为n的简单随机样本(简称样本),
它们的观察值X1,…,Xn称为样本值,又称为X的n个独立观察值。
所以(X1,…,Xn)的联合分布函数为
F∗(X1,..,Xn)=F(x1)…F(Xn)=∏ni=1F(xi)F∗(X1,..,Xn)=F(x1)…F(Xn)=∏i=1nF(xi)
若X具有概率密度f,则(X1,…,Xn)的联合概率密度为
f∗(X1,..,Xn)=f(x1)…f(Xn)=∏ni=1f(xi)f∗(X1,..,Xn)=f(x1)…f(Xn)=∏i=1nf(xi)
若总体X是离散型随机变量,分布律为P{X=x}=p(x),则(X1,…,Xn)的联合分布律为
P{ X1=x1,..,Xn=XnX1=x1,..,Xn=Xn}=p(x1)…p(xn)p(x1)…p(xn)
例如总体X服从0-1分布b(1,p)
p{X=x}=p(x)=pxq1−xpxq1−x
p(x1)…p(xn)p(x1)…p(xn)=∏ni=1pxiq1−Xi∏i=1npxiq1−Xi=p∑ni=1xiqn−∑ni=1zip∑i=1nxiqn−∑i=1nzi
直方图和箱线图
统计量
定义
设X1,…,Xn是来自总体X的一个样本,g(X1,…,Xn)是X1,…,Xn的函数,若g中不含未知数,则称g(X1,…,Xn)是一个统计量。
因为X1,…,Xn都是随机变量,故统计量g(X1,…,Xn)作为X1,…,Xn的函数,也是随机变量。
设X1,…,Xn是相应于样本X1,…,Xn的样本值,则称g(X1,…,Xn)是统计量g(X1,…,Xn)的观测值。
常用统计量
设X1,…,Xn是来自总体X的一个样本,X1,…,Xn是这一样本的观察值。
统计平均值(样本均值)Sample means
X⎯⎯⎯⎯=1n∑bi=1XiX¯=1n∑i=1bXi
相应的观察值 x⎯⎯⎯=1n∑bi=1xix¯=1n∑i=1bxi
样本方差 Sample variance
S2=1n−1∑ni=1(Xi−X⎯⎯⎯⎯)2S2=1n−1∑i=1n(Xi−X¯)2
相应的观察值 s2=1n−1∑ni=1(xi−x⎯⎯⎯)2s2=1n−1∑i=1n(xi−x¯)2
样本标准差 Sample standard deviation
S=S2‾‾‾√=1n−1∑ni=1(Xi−X⎯⎯⎯⎯)2‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾√S=S2=1n−1∑i=1n(Xi−X¯)2
相应的观察值
s=1n−1∑ni=1(xi−x⎯⎯⎯)2‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾√s=1n−1∑i=1n(xi−x¯)2
样本k阶(原点)矩 k-th monent of the sample
Ak=1n∑ni=1XkiAk=1n∑i=1nXik k=1,2,..
相应的观察值 ak=1n∑ni=1xkiak=1n∑i=1nxik
样本k阶中心矩
Bk=1n∑ni=1(Xi−X⎯⎯⎯⎯)kBk=1n∑i=1n(Xi−X¯)k
相应的观察值bk=1n∑ni=1(xi−x⎯⎯⎯)kbk=1n∑i=1n(xi−x¯)k
总体X的方差σ2X=1N∑ni=1(Xi−X⎯⎯⎯⎯)2σX2=1N∑i=1n(Xi−X¯)2
总体均值X⎯⎯⎯⎯=1N∑Ni=1XiX¯=1N∑i=1NXi
当样本X1,..,Xn容量较少是
总体方差较小,故样本方差修正为n-1
对于较大的n,两者几无差异。
若总体X的k阶矩E(Xk)=μkE(Xk)=μk存在,则当n趋于无穷大是,样本k阶矩将依概率收敛与总体的k阶矩,即
Ak−→PμAk→Pμ Ak=1n∑ni=1Xki