中心极限定律
中心极限定理:无论是多么复杂,多么乱的分布,甚至未知分布,取一定容量(个数)的样本,求样本均值(样本和),这样重复多次,得到的样本均值(样本和)都服从正态分布,尤其是当取值次数趋于无穷大时。
样本抽样
- 总体是你所研究的所有事件的集 合。
- 样本是从总体中选取的相对较小 的集合,可用于做出关于总体本身 的结论。
- 进行抽样时,首先定义目标总体, 即要研究的总体。然后确定抽样单 位,即要抽样的对象类型。最后, 拟定一个抽样空间,即目标总体中 的所有抽样单位的列表。
如果样本不能代表目标总体,则这 个样本存在偏倚。
抽样形式
- 简单随机抽样即随机选择抽样单位 并形成样本,包括重复抽样和不重复抽样。简单随机抽样的具体方式 包括抽签或棚随机编器。
- 分层抽样即将总体划分为几个组, 或者叫做几个层,组或层中的单位 都很相似,每一层都尽可能与其他 层不一样。分好层以后,就对每一 层执行简单随机抽样。
- 整群抽样即将总体划分为几个群, 其中每个群都尽置与其他群相似, 可通过简单随机柚样柚取几个群, 然后用这些群中的每一个柚样单位 形成样本。
- 系统抽样即选取一个数字k,然后 每到第k个抽样单位就抽样一次。
样本均值的抽样分布
总体分布非正态,但方差已知,这时当样本足够大时,其样本均值的分布为渐近正态分布。 接近正态分布的程度与样本n及其总体偏斜程度有关。样本n越大,接近得就越好或总体偏态越小
样本均值抽样的方差
样本均值抽样分布的方差等于原分布的方差除以样本容量,公式:
σ x ‾ 2 = σ 2 n \sigma_{\overline{x}}^2=\frac{\sigma^2}{n} σx2=