一、基本概念
在统计中,我们把需要用样本去推断“正确”与否的命题称为一个假设。当然,假设是可以关于参数的,也可以是关于分布的。
通过样本对一个假设作出“对”或“不对”的具体判断规则就称为该假设的一个检验。检验的结果若“是”,则否定该命题,就称拒绝该假设,否则就称为接受原假设。这里的拒绝和接受原假设,只是在当前样本下作出的判断,并没有从逻辑或理论上“证明”该命题正确与否。
设有样本 X X X,取值于样本空间 X \mathcal X X,且知道样本来自某一个参数分布族 { F ( x , θ ) : θ ∈ Θ } \{F(x,\theta): \theta\in\Theta\} {
F(x,θ):θ∈Θ},其中 Θ \Theta Θ为参数空间。设 Θ 0 ⊂ Θ \Theta_0\subset\Theta Θ0⊂Θ,且 Θ 0 ≠ ∅ \Theta_0\ne\varnothing Θ0=∅,则命题 H 0 : θ ∈ Θ 0 H_0:\theta\in\Theta_0 H0:θ∈Θ0称为一个假设或零假设。如记 Θ 1 = Θ − Θ 0 \Theta_1=\Theta-\Theta_0 Θ1=Θ−Θ0,则命题 H 1 : θ ∈ Θ 1 H_1:\theta\in\Theta_1 H1:θ∈Θ1称为 H 0 H_0 H0的备择假设。于是 H 0 : θ ∈ Θ 0 ↔ H 1 : θ ∈ Θ 1 (1) H_0:\theta\in\Theta_0\leftrightarrow H_1:\theta\in\Theta_1\tag1 H0:θ∈Θ0↔H1:θ∈Θ1(1)
称为假设检验问题。
对于上述假设的检验就是指这样一个法则或策略:当有了具体的样本后,由该法则或策略就可决定是接受 H 0 H_0 H0还是拒绝 H 0 H_0 H0,即检验就等价于把样本空间 X \mathcal X X划分成两个互不相交的部分 W W W和 W ‾ \overline W W,当样本属于 W ‾ \overline W W时,接受 H 0 H_0 H0;否则拒绝 H 0 H_0 H0。于是,我们称 W W W为该检验的拒绝域,而 W ‾ \overline W W称为接受域
由于样本是随机的,所以我们有可能会做出错误的决策,即当 θ ∈ Θ 0 \theta\in\Theta_0 θ∈Θ0时,样本却落入了拒绝域 W W W,于是采取了拒绝 H 0 H_0 H0的错误决策,称这样的错误为第一类错误;当 θ ∈ Θ 1 \theta\in\Theta_1 θ∈Θ1时,样本却落入了接受域 W ‾ \overline W W,于是采取了接受 H 0 H_0 H0的错误决策,称这样的错误为第二类错误。具体可见下表:
| 决策 | H 0 H_0 H0为真 | H 1 H_1 H1为真 |
|---|---|---|
| 接受 H 0 H_0 H0 | 正确 | 第二类错误 |
| 拒绝 H 0 H_0 H0 | 第一类错误 | 正确 |
- 定义犯第一类错误的概率为 α = P { X ∈ W ∣ H 0 } \alpha=P\{\bm X\in W|H_0\} α=P{ X∈W∣H0}
- 定义犯第二类错误的概率为 β = P { X ∈ W ‾ ∣ H 1 } \beta=P\{\bm X\in\overline W|H_1\} β=P{ X∈W∣H1}
- 对于固定的样本容量,找不到一个检验方法,使得犯第一、二类错误的概率均达到最小
势函数:对于假设 ( 1 ) (1) (1)的一个检验方法 ψ \psi ψ,其拒绝域记作 W W W,则称 β ψ ( θ ) = P θ { X ∈ W } , ∀ θ ∈ Θ (2) \beta_\psi(\theta)=P_\theta\{\bm X\in W\}, \forall\theta\in\Theta\tag2 βψ(θ)=Pθ{
X∈W},∀θ∈Θ(2)
为此检验的势函数。
所以当 θ ∈ Θ 0 \theta\in\Theta_0 θ∈Θ0时,此检验犯第一类错误的概率等于其势函数 β ψ ( θ ) \beta_\psi(\theta) βψ(θ);而当 θ ∈ Θ 1 \theta\in\Theta_1 θ∈Θ1时,检验犯第二类错误的概率等于 1 − β ψ ( θ ) 1-\beta_\psi(\theta) 1−βψ(θ)
显著性水平:对于检验 ψ \psi ψ和事先给定的 α ∈ ( 0 , 1 ) \alpha\in(0,1) α∈(0,1),如果它满足 P θ { X ∈ W } ≤ α , ∀ θ ∈ Θ 0 (3) P_\theta\{\bm X\in W\}\le\alpha, \forall \theta\in\Theta_0\tag3 Pθ{
X∈W}≤α,∀θ∈Θ0(3)
则称 α \alpha α是检验 ψ \psi ψ的显著性水平或水平,也称 ψ \psi ψ为显著性水平 α \alpha α的检验。即检验 ψ \psi ψ犯第一类错误的概率不大于 α \alpha α.
只控制一个检验犯第一类错误的概率时,称这样的检验为显著性检验。一般情况下,求取某假设的显著性检验的步骤如下:
- 根据实际问题,建立统计假设 H 0 ↔ H 1 H_0\leftrightarrow H_1 H0↔H1
- 选取一个合适的统计量 T ( X ) T(\bm X) T(X),使当 H 0 H_0 H0成立时, T T T的分布已知,且与参数 θ \theta θ无关(称此分布为统计量 T T T的零分布)
- 根据 H 0 H_0 H0及 H 1 H_1 H1的特点,确定拒绝域 W W W的区间形式
- 对于给定的显著性水平 α \alpha α,确定拒绝域 W W W
- 由样本观测值 x \bm x x,计算统计量 T ( X ) T(\bm X) T(X)的值 T ( x ) T(\bm x) T(x),由 T ( x ) T(\bm x) T(x)是否属于 W W W,作出最终判断。
二、单样本正态总体参数的显著性检验
在本节中,始终假设 X 1 , ⋯ , X n X_1,\cdots,X_n X1,⋯,Xn为来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的 I I D IID IID样本,且我们感兴趣的是关于 μ \mu μ和 σ 2 \sigma^2 σ2的检验问题。
2.1 单样本正态总体均值的检验
| 方差 | 假设 | 检验统计量 | 拒绝域 | 名字 |
|---|---|---|---|---|
| σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0↔H1:μ=μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} { ∣U∣>uα/2} | 双侧 u u u检验 |
| σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0↔H1:μ<μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U < − u α } \{U\lt -u_{\alpha}\} { U<−uα} | 单侧 u u u检验 |
| σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0↔H1:μ>μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U > u α } \{U\gt u_{\alpha}\} { U>uα} | 单侧 u u u检验 |
| σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ≤μ0↔H1:μ>μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U > u α } \{U\gt u_{\alpha}\} { U>uα} | 单侧 u u u检验 |
| σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 | H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ≥μ0↔H1:μ<μ0 | U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n(X−μ0)/σ0 | { U < − u α } \{U\lt -u_{\alpha}\} { U<−uα} | 单侧 u u u检验 |
| σ 2 \sigma^2 σ2未知 | H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0↔H1:μ=μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { ∣ T ∣ > t α / 2 ( n − 1 ) } \{\mid T\mid\gt t_{\alpha/2}(n-1)\} { ∣T∣>tα/2(n−1)} | 双侧 t t t检验 |
| σ 2 \sigma^2 σ2未知 | H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0↔H1:μ<μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} { T<−tα(n−1)} | 单侧 t t t检验 |
| σ 2 \sigma^2 σ2未知 | H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0↔H1:μ>μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} { T>tα(n−1)} | 单侧 t t t检验 |
| σ 2 \sigma^2 σ2未知 | H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ≤μ0↔H1:μ>μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X−μ0)/Sn | { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} { T>tα(n−1)} | 单侧 t t t检验 |
| σ 2 \sigma^2 σ2未知 | H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ≥μ0↔H1:μ<μ0 | T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n(X |

本文介绍了统计学中的假设检验原理,包括基本概念、单样本和两样本正态总体参数的显著性检验方法,以及似然比检验和p值的概念。详细讨论了如何选择检验统计量、确定拒绝域和控制第一类错误的概率。
最低0.47元/天 解锁文章
3748

被折叠的 条评论
为什么被折叠?



