一、正态分布
正态分布是三大抽样分布的基础,我们先来看看关键的定理和结论:
1. Fisher 定理
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn 是总体
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2) 的一组样本,样本均值是
X
‾
\overline X
X,样本方差是
s
2
\ s^2
s2.
则:
-
X
‾
∼
N
(
μ
,
σ
2
n
)
\overline X \sim N(\mu,\frac{\sigma^2 }{n})
X∼N(μ,nσ2)
说明样本均值这个随机变量的分布 - ( n − 1 ) s 2 σ 2 \frac {(n-1)s^2}{\sigma^2} σ2(n−1)s2 服从卡方n-1
- 样本均值和样本方差相互独立
2. 正态总体用样本方差代替总体方差
在总体方差不知道的情况下,我们通过用样本计算得到的样本方差代替总体方差的方式可以得到某个统计量服从t分布
- 原理:样本均值这个随机变量,减去总体均值,再除以由样本值算得的样本标准差(相当于拿由样本计算得到的方差去估计总体方差 σ 2 \sigma^2 σ2)得到的随机变量服从t分布。
- 数理证明:分式上下同时除以总体真实的标准差,即, σ \sigma σ,稍微变形(和Fisher定理的第三条结合一下),分子服从的是标准正态分布,分母是根号下的卡方n-1除以自由度。
二、卡方分布
- 自由度为n: n个独立同分布的正态分布的平方和
- 均值为n, 方差为2n
三、t分布
- X ∼ N ( 0 , 1 ) , Y ∼ χ 2 ( n ) , 相 互 独 立 , 称 X Y n ∼ t ( n ) X \sim N(0,1),Y\sim \chi^2(n),相互独立,称\frac{X}{\sqrt{\frac{Y}{n}}}\sim t(n) X∼N(0,1),Y∼χ2(n),相互独立,称nYX∼t(n)
四、F分布
- 自由度为n的卡方分布除以n,自由度为m的卡方分布除以m,两者相除得到的F(n,m)分布
- T 2 ∼ F ( 1 , n ) T^2\sim F(1,n) T2∼F(1,n)
五、 正态总体
在已经了解了一下三大抽样分布之后,可以讨论正态总体的性质:
1. 单样本
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn 是总体
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2) 的一组样本,样本均值是
X
‾
\overline X
X,样本方差是
s
2
\ s^2
s2.
则:
n
(
X
‾
−
μ
)
s
∼
t
(
n
−
1
)
\frac{\sqrt n(\overline X-\mu)}{s} \sim t(n-1)
sn(X−μ)∼t(n−1)
- 原理:分式上下同时除以 σ , 分 母 就 是 服 从 标 准 正 态 分 布 , 参 见 \sigma,分母就是服从标准正态分布,参见 σ,分母就是服从标准正态分布,参见Fisher 定 理 第 一 条 ; 分 子 是 ( n − 1 ) s 2 σ 2 ( n − 1 ) 定理第一条;分子是\sqrt{\frac{(n-1)s^2}{\sigma^2 (n-1)}} 定理第一条;分子是σ2(n−1)(n−1)s2,不看 σ 2 旁 边 的 ( n − 1 ) , 根 号 里 面 的 东 西 服 从 卡 方 n − 1 ( 参 见 \sigma^2旁边的(n-1),根号里面的东西服从卡方n-1(参见 σ2旁边的(n−1),根号里面的东西服从卡方n−1(参见Fisher 定 理 第 三 条 ) , 现 在 再 看 σ 2 旁 边 的 ( n − 1 ) , 是 自 由 度 定理第三条),现在再看\sigma^2旁边的(n-1),是自由度 定理第三条),现在再看σ2旁边的(n−1),是自由度;两个相除,就服从t分布,自由度n-1
2. 两样本
-
X
1
,
X
2
,
.
.
.
,
X
n
是
总
体
N
(
μ
1
,
σ
1
2
)
的
样
本
X_1,X_2,...,X_n 是总体 N(\mu_1,\sigma^2_1)的样本
X1,X2,...,Xn是总体N(μ1,σ12)的样本,
Y
1
,
Y
2
,
.
.
.
,
Y
n
是
总
体
N
(
μ
2
,
σ
2
2
)
的
样
本
Y_1,Y_2,...,Y_n 是总体 N(\mu_2,\sigma^2_2)的样本
Y1,Y2,...,Yn是总体N(μ2,σ22)的样本,两样本独立,他们的样本方差分别是
S
x
2
,
S
y
2
S_x^2,S_y^2
Sx2,Sy2,那么
F = S x 2 σ 1 2 S y 2 σ 2 2 ∼ F ( m − 1 , n − 1 ) F=\frac{ \frac {S_x^2 }{\sigma_1^2 } }{ \frac {S_y^2 }{\sigma_2^2 }} \sim F(m-1,n-1) F=σ22Sy2σ12Sx2∼F(m−1,n−1)
- 原理:通过实验得到的n个样本方差和真实的总体方差的比值是卡方n-1除以自由度,因为乘以(n-1),就是Fisher定理的第二条。
-
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn 是总体
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2) 的一组样本,样本均值是
X
‾
\overline X
X,样本方差是
s
x
2
,
Y
1
,
Y
2
,
.
.
.
,
Y
n
\ s_x^2,Y_1,Y_2,...,Y_n
sx2,Y1,Y2,...,Yn 是总体
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2) 的一组样本,样本均值是
Y
‾
\overline Y
Y,样本方差是
s
y
2
,
S
w
2
=
(
m
−
1
)
S
x
2
+
(
n
−
1
)
S
y
2
m
+
n
−
2
\ s_y^2, S_w^2=\frac{(m-1)S_x^2+(n-1)S_y^2}{m+n-2}
sy2,Sw2=m+n−2(m−1)Sx2+(n−1)Sy2
T = ( X ‾ − Y ‾ ) − ( μ 1 − μ 2 ) S w ( 1 m + 1 n ) ∼ t ( m + n − 2 ) T=\frac{(\overline X-\overline Y)-(\mu_1-\mu_2)}{S_w\sqrt{(\frac{1}{m}+\frac{1}{n})}} \sim t(m+n-2) T=Sw(m1+n1)(X−Y)−(μ1−μ2)∼t(m+n−2)
- 原理:
以上内容都是我个人的学习笔记,若出现错误欢迎指正!