正态分布
X
~
N
(
μ
,
σ
2
)
X\text{\textasciitilde} N(\mu,\sigma^2)
X~N(μ,σ2)
X
−
u
σ
~
(
0
,
1
)
\frac{X-u}{\sigma} \text{\textasciitilde} (0,1)
σX−u~(0,1)
如果总体服从正态分布,则样本均值的抽样分布都服从正态分布
t
t
t分布
假设
X
X
X服从标准正态分布,
Y
Y
Y服从
χ
2
(
n
)
\chi ^2(n)
χ2(n)分布
Z
~
t
(
n
)
Z \text{\textasciitilde} t(n)
Z~t(n)
Z
=
X
Y
/
n
Z=\frac{X}{\sqrt{Y/n}}
Z=Y/nX
总体均值的估计
当总体服从正态分布且方差已知时,样本均值
x
x
x的抽样分布均为正态分布,其数学期望为总体均值
μ
\mu
μ,方差为
σ
2
n
\frac{\sigma ^ 2}{n}
nσ2,而样本均值经过标准化以后的随机变量则服从标准正态分布,即
z
=
x
‾
−
μ
σ
/
n
~
N
(
0
,
1
)
z=\frac{\overline x - \mu}{\sigma / \sqrt n} \text{\textasciitilde} N(0,1)
z=σ/nx−μ~N(0,1)
当总体服从正态分布,但是方差未知,而且是在小样本的情况下,则需要用样本方差 s 2 s^2 s2代替总体方差 σ 2 \sigma ^ 2 σ2,这时样本均值经过标准化以后的随机变量服从自由度为 n − 1 n-1 n−1的 t t t分布
t = x ‾ − μ s / n ~ t ( n − 1 ) t=\frac{\overline x - \mu}{s/\sqrt n} \text{\textasciitilde}t(n-1) t=s/nx−μ~t(n−1)
如果总体并不服从正态分布,只要是在大样本的情况下,就可以用用样本方差
s
2
s^2
s2代替总体方差
σ
2
\sigma ^ 2
σ2,而样本均值经过标准化以后的随机变量则服从标准正态分布,即
z
=
x
‾
−
μ
σ
/
n
~
N
(
0
,
1
)
z=\frac{\overline x - \mu}{\sigma / \sqrt n} \text{\textasciitilde} N(0,1)
z=σ/nx−μ~N(0,1)
总体均值之差估计
当两个总体都服从正态分布或两个总体不服从正态分布但两个样本都为大样本时,根据抽样分布的知识可知,两个样本均值之差
x
‾
1
−
x
‾
2
\overline x_1- \overline x_2
x1−x2的抽样分布服从期望值为
μ
1
−
μ
2
\mu_1-\mu_2
μ1−μ2,方差为
σ
1
2
n
1
+
σ
2
2
n
2
\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}
n1σ12+n2σ22的正态分布,而两个样本均值之差经标准化后服从标准正态分布,即
z
=
(
x
‾
1
−
x
‾
2
)
−
(
μ
1
−
μ
2
)
σ
1
2
n
1
+
σ
2
2
n
2
~
N
(
0
,
1
)
z=\frac{(\overline x_1-\overline x_2)-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \text{\textasciitilde} N(0,1)
z=n1σ12+n2σ22(x1−x2)−(μ1−μ2)~N(0,1)
当两个总体方差未知时,可用两个样本方差来代替
小样本的估计:
当两个总体方差未知但相等时,两个样本均值之差经标准化后服从自由度为
n
1
+
n
2
−
2
n_1+n_2-2
n1+n2−2的
t
t
t分布
当两个总体方差未知且不相等时,只要两个总体都服从正态分布,而且两个样本的样本量相等,两个样本均值之差经标准化后服从自由度为
n
1
+
n
2
−
2
n_1+n_2-2
n1+n2−2的
t
t
t分布
当两个总体的方差未知且不相等时,而两个样本的样本量不相等,两个样本均值之差服从自由度为
v
v
v的
t
t
t分布
总体方差的估计
根据样本方差的抽样分布可知,样本方差服从自由度为 n − 1 n-1 n−1的 χ 2 \chi ^2 χ2分布
两个样本方差比的抽样分布服从 F F F分布
单个样本的假设检验
非参数检验
单样本符号检验,符号检验是一种利用正、负号的数目对某种假设做出判断的非参数检验方法
常被用于检验总体的均值、中位数等参数是否为某一数值,或判断总体分布有无变化
单样本Wilcoxon符号检验,Wilcoxon检验是一种经过改进的符号检验
方差分析
方差分析又称变异数分析或 F F F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。
单因素方差分析,当方差分析中只涉及一个分类型自变量时称为单因素方差分析
S
S
T
SST
SST总平方和反映全部观察值的离散状况
S
S
A
SSA
SSA组间平方和反映各总体的样本均值之间的差异程度
S
S
E
SSE
SSE组内平方和反映每个样本各观察值的离散状况
M
S
A
MSA
MSA组间均方
M
S
E
MSE
MSE组内均方
F
=
M
S
A
M
S
E
~
F
(
k
−
1
,
n
−
k
)
F=\frac{MSA}{MSE} \text{\textasciitilde} F(k-1,n-k)
F=MSEMSA~F(k−1,n−k)
双因素方差分析
在双因素试验中,试验的结果同时受两个因素的影响,这两个因素分别称为行因素和列因素
当两个影响因素彼此相互独立,此时的双因素方差分析称为无重复的双因素方差分析
当两个影响因素彼此相互影响,此时的双因素方差分析称为有重复的双因素方差分析
无重复的双因素方差分析
S
S
T
SST
SST总平方和反映全部观察值的离散状况
S
S
R
SSR
SSR行因素误差平方和
S
S
C
SSC
SSC列因素误差平方和
S
S
E
SSE
SSE随机误差项平方和
M
S
R
MSR
MSR行因素的均方
M
S
C
MSC
MSC列因素的均方
M
S
E
MSE
MSE误差项的均方
检查行因素的统计量计算公式为
F
=
M
S
R
M
S
E
~
F
(
k
−
1
,
(
k
−
1
)
(
r
−
1
)
)
F=\frac{MSR}{MSE} \text{\textasciitilde} F(k-1,(k-1)(r-1))
F=MSEMSR~F(k−1,(k−1)(r−1))
检查列因素的统计量计算公式为
F
=
M
S
C
M
S
E
~
F
(
r
−
1
,
(
k
−
1
)
(
r
−
1
)
)
F=\frac{MSC}{MSE} \text{\textasciitilde} F(r-1,(k-1)(r-1))
F=MSEMSC~F(r−1,(k−1)(r−1))
可重复的双因素方差分析
如果两个因素对因变量的影响是独立的,但两个因素搭配在一起会对因变量产生一种新的效应,就需要考虑交互作用对因变量的影响
S
S
T
SST
SST总平方和反映全部观察值的离散状况
S
S
R
SSR
SSR行因素误差平方和
S
S
C
SSC
SSC列因素误差平方和
S
S
E
SSE
SSE随机误差项平方和
M
S
R
MSR
MSR行因素的均方
M
S
C
MSC
MSC列因素的均方
M
S
E
MSE
MSE误差项的均方
S
S
R
C
SSRC
SSRC交互作用相平方和
M
S
R
C
MSRC
MSRC交互作用的均方
M
E
C
MEC
MEC误差项均方
F
R
C
=
M
S
R
C
M
S
E
~
F
F_{RC}=\frac{MSRC}{MSE} \text{\textasciitilde} F
FRC=MSEMSRC~F