泊松分布样本均值的数学期望_抽样分布

本文探讨了统计量的概念,包括样本均值、样本方差、样本变异系数、样本K阶矩等,并解释了它们在描述数据集中分散程度的作用。此外,文章介绍了抽样分布,如卡方分布、T分布和F分布,以及在不同样本大小下,如大样本时比例分布逼近正态分布的中心极限定理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、统计量

样本均值:从总体中抽样的数据集叫样本。样本总和除以样本总数即为样本均值。

样本方差:样本与样本均值之差的平方的和,除以(样本总数-1)。

样本变异系数:样本标准差与样本均值之比,是在消除量纲影响后的样本分散程度的一种度量。

样本K阶矩:专业术语应该为样本K阶原点矩,样本K次方的和的均值。

0723b5787f3c4bfc0a6cb96258e94457.png

样本K阶中心矩:(样本减去样本均值)的K次方的和的均值。

33a7597661962904129b67a1c215728f.png

样本偏度:样本偏度是样本3阶中心矩除以(样本2阶中心矩的3/2次幂)的商,记为Sk。样本偏度常用作总体偏度的估计量和检验总体分布正态性的统计量。

9b395f2f54ea1ce738dc64864b3a6b1b.png

样本峰度:样本4阶中心矩除以(样本2阶中心矩平方)的商再减去3,记为Ku。样本峰度常用以作总体峰度的估计量,正态分布的峰度为0,非正态分布的峰度是以正态分布的峰度为标准来描述其分布密度形状为陡峭或平坦的一个数字特征。

次序统计量:设 X1,X2, …, Xn是取自总体X的样本,X(i) 称为该样本的第i个次序统计量,它的取值是将样本观测值由小到大排列后得到的第i个观测值。从小到大排序为x(1),x(2), …,x(n),则称X(1),X(2), …,X(n)为顺序统计量。

充分统计量:对于给定的统计推断问题,包含了原样本中关于该问题的全部有用信息的统计量。对于未知参数的估计问题,保留了原始样本中关于未知参数θ的全部信息的统计量,就是充分统计量。如样本均值X是总体数学期望的充分统计量。数学上,设(X₁, …,Xₑ)是来自总体X的一个随机样本,T=T(X₁, …,Xₑ)是一统计量。若在T=t的条件下,样本的条件分布与未知参数θ无关,则称统计量T是θ的充分统计量。样本中包含关于总体的信息可分为两部分:其一是关于总体结构的信息,即反映总体分布的结构;其二是关于总体中未知参数的信息,这是由于样本的分布中包含了总体分布中的未知信息。我们对信息的加工只会减少,不会增多,即统计量具有压缩数据功能,但会凸显我们需要的信息。那么一个好的统计量应该能将样本中包含未知参数的全部信息提取出来,即样本加工不损失未知参数的信息称为充分性。

二、抽样分布

卡方分布:若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布,则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。

a9c88734ec6fba15ea51326a028f8c97.png

T分布:即学生t-分布,用于根据小样本(样本数小于30)来估计呈正态分布且方差未知的总体的均值。

F分布:若总体X~N(0,1),(X1,X2,……Xn1)与(Y1,Y2,……Yn2)为来自X的两个独立样本,设统计量

e98f72ac7badd0810c1c5e44a40bcbfa.png

则称统计量F服从自由度n1和n2的F分布,记为F~F(n1,n2)。

样本方差的分布:

58030f01f47048fdc13246e6e0ce4193.png

样本比例的抽样分布:

209db35c34755e2976b40071fd071e35.png

大样本时比例分布逼近正态分布

dbbdba58a21f860eecfbc62a7d614aa1.png

中心极限定理:

9f718f2783bfbc26fc1d2fdefb2909b5.png

两个样本平均值之差的分布:

268e7b5dff89441ea454e389a6dbb189.png

两样本方差之比的分布:

e4af3c257c4f66273d7f304c25c31520.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值