第五章数理统计--样本和抽样分布

本文介绍了数理统计的基本概念,如总体、样本等,并探讨了数据收集方法及抽样原理。文章还详细阐述了几种重要的抽样分布,包括正态分布、卡方分布、t分布和F分布,并给出了单个正态总体和两个正态总体的抽样分布。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

从今天开始要学习数理统计。
概率论:是专门研究随机现象的一门学科,定量描述随机现象及其规律。
数理统计:数理统计的研究对象是数据,包括对数据的采集、整理、分析、建模。主要任务是获取样本、描述样本,从样本得到总体的分布情况和分布参数。

基本概念

 总体:研究对象的全体。
 个体:总体中的成员。
 总体的容量:总体中包含的个体数。
 有限总体:容量有限的总体。
 无限总体:容量不可数的总体。有限总体量非常大的时候,也看作是无限总体。
 总体的某个指标X,对于不同个体,有不同的值。X可以看做是随机变量。假设X的分布函数为F(X),也称总体X具有分布函数F(X)。

数据收集

 数据收集方法有两种。1 调查记录,例如是否做过家教。2 试验记录。例如药物反应。

抽样

 数理统计的目标是从样本推总体。使用的方法是抽样。
 样本:从总体中抽取到的部分个体叫样本。
 简单随机样本:满足以下两个条件的随机样本(X1,X2...Xn)称为容量为n的简单随机样本:1 每个Xi与X同分布;2 X1,X2...Xn是相互独立的随机变量。详细解释第一个条件。一批灯泡的寿命服从π(λ)。这个总体中任何一个样本的寿命都是服从π(λ),所以任意抽取一个就可以。如果这里面混入了别人家的产品,这个产品服从π(λ1),那这个抽样就要出问题了。或者这里混入了IBM笔记本。笔记本寿命可能就不符合泊松分布了。
 一个容量为n的样本X1,X2...Xn是指n个独立的与总体分布相同的随机变量。
 样本观察值:对样本进行一次观察,得到实际的值。
 抽样分不放回抽样、放回抽样。
 统计量:样本的不包含任何未知参数的函数。
 样本均值:X¯¯¯=1nni=1Xi
 样本方差:S2=1n1ni=1(XiX¯¯¯)2
 标准差:S=S2
 k阶矩:Ak=1nni=1Xki
 k阶中心矩:Bk=1nni=1(XiX¯¯¯)k
 B2=n1nS2

样本分位数

 样本p分位数:1至少有np个观察值小于等于xp;2 至少有n(1-p)个观察值大于等于xp。(0<p<1)。样本中位数M、第一四分位数Q1、第三四分位数Q3
 例如:一组容量为18的样本值如下:
 122 126 122 140 145 149 150 157
 162 166 175 177 183 188 199 212
 x0.2=x(n0.2)=x([180.2]+1)=x([3.6]+1)=x4=140
 x0.25=x(n0.25)=x([180.25]+1)=x([4.5]+1)=x5=145
 x0.5=?:18*0.5=9;x0.5=12(157+162)=159.5
 箱线图:最小值Min,第一四分位数Q1、样本中位数M、第三四分位数Q3、样本最大值Max,五个数据画成的图。

重要的抽样分布

 统计量的分布称为抽样分布。
 几个重要的抽样分布:正态分布、卡方分布、t分布、F分布。

卡方分布

 定义:设随机变量X1,...Xn相互独立,且都服从N(0,1),则称=ni=1X2i服从自由度为n的卡方分布。
 概率密度函数:
 性质:
 1 E(卡方分布)=n,D(卡方分布)=2n。
 2 可加性。Y1 (n1)Y2 (n2),且Y1,Y2相互独立,则Y1+Y2 (n1+n2)
 上α分位数

t分布

 定义:设随机变量X~N(0,1),Y~卡方分布(n),X与Y相互独立,则称变量T=XY/n 服从 t(n)。
 概率密度函数:
 上α分位数

F分布

 定义:设随机变量X~(n1),Y~卡方分布(n2),X与Y相互独立,则称变量F=X/n1Y/n2 服从F(n1,n2)
 概率密度函数:
 性质:
 1 如果FF(n1,n2),则1F~F(n2,n1).
 上α分位数
  

单个正态总体的抽样分布

 设总体X的均值为μ,方差为σ2X1,X2,...Xn是来自X的一个样本,样本均值X¯¯¯=1nni=1Xi,样本方差S2=1n1ni=1(XiX¯¯¯)2,则有E(X¯¯¯)=μD(X¯¯¯)=σ2nE(S2)=σ2
 
 定理一:总体X~N(μ,σ2)X1,X2,...Xn是样本,样本均值X¯¯¯=1nni=1Xi,样本方差S2=1n1ni=1(XiX¯¯¯)2,则
 
 (1)X¯¯¯N(μ,σ2n)
 (2)(n1)S2σ2~卡方分布(n-1),S2X¯¯¯相互独立。
 定理二:总体X~N(μ,σ2)X1,X2,...Xn是样本,样本均值X¯¯¯=1nni=1Xi,样本方差S2=1n1ni=1(XiX¯¯¯)2,则X¯¯¯μS/n~t(n-1)

两个正态总体的抽样分布

 定理三:设样本(X1,X2...Xn)和(Y1,Y2...Yn)分别来自总体N(μ1,σ21)N(μ2,σ22),并且它们相互独立,样本均值分别为X¯¯¯Y¯¯¯;样本方差分为别S21S22,则可以得到以下抽样分布:
 1 F=S21/σ21S22/σ22=S21/S22σ21/σ22~F(n11,n21)
 
 2 (X¯¯¯Y¯¯¯)σ21n1+σ22n2N(0,1)
 3 当σ21=σ22=σ2时,(X¯¯¯Y¯¯¯)Sw1n1+1n2t(n1+n22),其中S2w=(n11)S21+(n21)S22n1+n22Sw=S2w

总结

1 设样本X1,X2...Xn是来自总体X的样本,不管X服从什么分布,只要期望和方差存在,具有E(X)=μD(X)=σ2,则有E(X¯¯¯)=μD(X¯¯¯)=σ2n
2 总体X~N(μ,σ2)X1,X2,...Xn是样本,样本均值X¯¯¯=1nni=1Xi,样本方差S2=1n1ni=1(XiX¯¯¯)2,则
 
 (1)X¯¯¯N(μ,σ2n)
 (2)(n1)S2σ2~卡方分布(n-1)
 (3)S2X¯¯¯相互独立。
 (4)X¯¯¯μS/n~t(n-1)
3 对于两个正态总体,有三条重要的结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值