正态分布
X~N(μ,σ2)X\text{\textasciitilde} N(\mu,\sigma^2)X~N(μ,σ2)
X−uσ~(0,1)\frac{X-u}{\sigma} \text{\textasciitilde} (0,1)σX−u~(0,1)
如果总体服从正态分布,则样本均值的抽样分布都服从正态分布
ttt分布
假设XXX服从标准正态分布,YYY服从χ2(n)\chi ^2(n)χ2(n)分布
Z~t(n)Z \text{\textasciitilde} t(n)Z~t(n)
Z=XY/nZ=\frac{X}{\sqrt{Y/n}}Z=Y/nX
总体均值的估计
当总体服从正态分布且方差已知时,样本均值xxx的抽样分布均为正态分布,其数学期望为总体均值μ\muμ,方差为σ2n\frac{\sigma ^ 2}{n}nσ2,而样本均值经过标准化以后的随机变量则服从标准正态分布,即
z=x‾−μσ/n~N(0,1)z=\frac{\overline x - \mu}{\sigma / \sqrt n} \text{\textasciitilde} N(0,1)z=σ/nx−μ~N(0,1)
当总体服从正态分布,但是方差未知,而且是在小样本的情况下,则需要用样本方差s2s^2s2代替总体方差σ2\sigma ^ 2σ2,这时样本均值经过标准化以后的随机变量服从自由度为n−1n-1n−1的ttt分布
t=x‾−μs/n~t(n−1)t=\frac{\overline x - \mu}{s/\sqrt n} \text{\textasciitilde}t(n-1)t=s/nx−μ~t(n−1)
如果总体并不服从正态分布,只要是在大样本的情况下,就可以用用样本方差s2s^2s2代替总体方差σ2\sigma ^ 2σ2,而样本均值经过标准化以后的随机变量则服从标准正态分布,即
z=x‾−μσ/n~N(0,1)z=\frac{\overline x - \mu}{\sigma / \sqrt n} \text{\textasciitilde} N(0,1)z=σ/nx−μ~N(0,1)
总体均值之差估计
当两个总体都服从正态分布或两个总体不服从正态分布但两个样本都为大样本时,根据抽样分布的知识可知,两个样本均值之差x‾1−x‾2\overline x_1- \overline x_2x1−x2的抽样分布服从期望值为μ1−μ2\mu_1-\mu_2μ1−μ2,方差为σ12n1+σ22n2\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}n1σ12+n2σ22的正态分布,而两个样本均值之差经标准化后服从标准正态分布,即
z=(x‾1−x‾2)−(μ1−μ2)σ12n1+σ22n2~N(0,1)z=\frac{(\overline x_1-\overline x_2)-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \text{\textasciitilde} N(0,1)z=n1σ12+n2σ22(x1−x2)−(μ1−μ2)~N(0,1)
当两个总体方差未知时,可用两个样本方差来代替
小样本的估计:
当两个总体方差未知但相等时,两个样本均值之差经标准化后服从自由度为n1+n2−2n_1+n_2-2n1+n2−2的ttt分布
当两个总体方差未知且不相等时,只要两个总体都服从正态分布,而且两个样本的样本量相等,两个样本均值之差经标准化后服从自由度为n1+n2−2n_1+n_2-2n1+n2−2的ttt分布
当两个总体的方差未知且不相等时,而两个样本的样本量不相等,两个样本均值之差服从自由度为vvv的ttt分布
总体方差的估计
根据样本方差的抽样分布可知,样本方差服从自由度为n−1n-1n−1的χ2\chi ^2χ2分布
两个样本方差比的抽样分布服从FFF分布
单个样本的假设检验
非参数检验
单样本符号检验,符号检验是一种利用正、负号的数目对某种假设做出判断的非参数检验方法
常被用于检验总体的均值、中位数等参数是否为某一数值,或判断总体分布有无变化
单样本Wilcoxon符号检验,Wilcoxon检验是一种经过改进的符号检验
方差分析
方差分析又称变异数分析或FFF检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。
单因素方差分析,当方差分析中只涉及一个分类型自变量时称为单因素方差分析
SSTSSTSST总平方和反映全部观察值的离散状况
SSASSASSA组间平方和反映各总体的样本均值之间的差异程度
SSESSESSE组内平方和反映每个样本各观察值的离散状况
MSAMSAMSA组间均方
MSEMSEMSE组内均方
F=MSAMSE~F(k−1,n−k)F=\frac{MSA}{MSE} \text{\textasciitilde} F(k-1,n-k)F=MSEMSA~F(k−1,n−k)
双因素方差分析
在双因素试验中,试验的结果同时受两个因素的影响,这两个因素分别称为行因素和列因素
当两个影响因素彼此相互独立,此时的双因素方差分析称为无重复的双因素方差分析
当两个影响因素彼此相互影响,此时的双因素方差分析称为有重复的双因素方差分析
无重复的双因素方差分析
SSTSSTSST总平方和反映全部观察值的离散状况
SSRSSRSSR行因素误差平方和
SSCSSCSSC列因素误差平方和
SSESSESSE随机误差项平方和
MSRMSRMSR行因素的均方
MSCMSCMSC列因素的均方
MSEMSEMSE误差项的均方
检查行因素的统计量计算公式为
F=MSRMSE~F(k−1,(k−1)(r−1))F=\frac{MSR}{MSE} \text{\textasciitilde} F(k-1,(k-1)(r-1))F=MSEMSR~F(k−1,(k−1)(r−1))
检查列因素的统计量计算公式为
F=MSCMSE~F(r−1,(k−1)(r−1))F=\frac{MSC}{MSE} \text{\textasciitilde} F(r-1,(k-1)(r-1))F=MSEMSC~F(r−1,(k−1)(r−1))
可重复的双因素方差分析
如果两个因素对因变量的影响是独立的,但两个因素搭配在一起会对因变量产生一种新的效应,就需要考虑交互作用对因变量的影响
SSTSSTSST总平方和反映全部观察值的离散状况
SSRSSRSSR行因素误差平方和
SSCSSCSSC列因素误差平方和
SSESSESSE随机误差项平方和
MSRMSRMSR行因素的均方
MSCMSCMSC列因素的均方
MSEMSEMSE误差项的均方
SSRCSSRCSSRC交互作用相平方和
MSRCMSRCMSRC交互作用的均方
MECMECMEC误差项均方
FRC=MSRCMSE~FF_{RC}=\frac{MSRC}{MSE} \text{\textasciitilde} FFRC=MSEMSRC~F
统计学基础:正态分布与抽样估计
本文深入探讨了正态分布的概念及其在抽样估计中的应用,包括总体均值估计、总体均值之差估计以及总体方差估计。此外,还介绍了在不同情况下如何使用样本方差代替总体方差,以及如何通过标准化处理使随机变量服从标准正态分布或t分布。文章还涵盖了方差分析、非参数检验以及单样本符号检验等统计学方法。
1745

被折叠的 条评论
为什么被折叠?



