数理统计复习笔记五——假设检验之显著性检验

本文介绍了统计学中的假设检验原理,包括基本概念、单样本和两样本正态总体参数的显著性检验方法,以及似然比检验和p值的概念。详细讨论了如何选择检验统计量、确定拒绝域和控制第一类错误的概率。

一、基本概念

在统计中,我们把需要用样本去推断“正确”与否的命题称为一个假设。当然,假设是可以关于参数的,也可以是关于分布的。

通过样本对一个假设作出“对”或“不对”的具体判断规则就称为该假设的一个检验。检验的结果若“是”,则否定该命题,就称拒绝该假设,否则就称为接受原假设这里的拒绝和接受原假设,只是在当前样本下作出的判断,并没有从逻辑或理论上“证明”该命题正确与否。

设有样本 X X X,取值于样本空间 X \mathcal X X,且知道样本来自某一个参数分布族 { F ( x , θ ) : θ ∈ Θ } \{F(x,\theta): \theta\in\Theta\} { F(x,θ):θΘ},其中 Θ \Theta Θ为参数空间。设 Θ 0 ⊂ Θ \Theta_0\subset\Theta Θ0Θ,且 Θ 0 ≠ ∅ \Theta_0\ne\varnothing Θ0=,则命题 H 0 : θ ∈ Θ 0 H_0:\theta\in\Theta_0 H0:θΘ0称为一个假设或零假设。如记 Θ 1 = Θ − Θ 0 \Theta_1=\Theta-\Theta_0 Θ1=ΘΘ0,则命题 H 1 : θ ∈ Θ 1 H_1:\theta\in\Theta_1 H1:θΘ1称为 H 0 H_0 H0备择假设。于是 H 0 : θ ∈ Θ 0 ↔ H 1 : θ ∈ Θ 1 (1) H_0:\theta\in\Theta_0\leftrightarrow H_1:\theta\in\Theta_1\tag1 H0:θΘ0H1:θΘ1(1)
称为假设检验问题

对于上述假设的检验就是指这样一个法则或策略:当有了具体的样本后,由该法则或策略就可决定是接受 H 0 H_0 H0还是拒绝 H 0 H_0 H0,即检验就等价于把样本空间 X \mathcal X X划分成两个互不相交的部分 W W W W ‾ \overline W W,当样本属于 W ‾ \overline W W时,接受 H 0 H_0 H0;否则拒绝 H 0 H_0 H0。于是,我们称 W W W为该检验的拒绝域,而 W ‾ \overline W W称为接受域

由于样本是随机的,所以我们有可能会做出错误的决策,即当 θ ∈ Θ 0 \theta\in\Theta_0 θΘ0时,样本却落入了拒绝域 W W W,于是采取了拒绝 H 0 H_0 H0的错误决策,称这样的错误为第一类错误;当 θ ∈ Θ 1 \theta\in\Theta_1 θΘ1时,样本却落入了接受域 W ‾ \overline W W,于是采取了接受 H 0 H_0 H0的错误决策,称这样的错误为第二类错误。具体可见下表:

决策 H 0 H_0 H0为真 H 1 H_1 H1为真
接受 H 0 H_0 H0 正确 第二类错误
拒绝 H 0 H_0 H0 第一类错误 正确
  • 定义犯第一类错误的概率为 α = P { X ∈ W ∣ H 0 } \alpha=P\{\bm X\in W|H_0\} α=P{ XWH0}
  • 定义犯第二类错误的概率为 β = P { X ∈ W ‾ ∣ H 1 } \beta=P\{\bm X\in\overline W|H_1\} β=P{ XWH1}
  • 对于固定的样本容量,找不到一个检验方法,使得犯第一、二类错误的概率均达到最小

势函数:对于假设 ( 1 ) (1) (1)的一个检验方法 ψ \psi ψ,其拒绝域记作 W W W,则称 β ψ ( θ ) = P θ { X ∈ W } , ∀ θ ∈ Θ (2) \beta_\psi(\theta)=P_\theta\{\bm X\in W\}, \forall\theta\in\Theta\tag2 βψ(θ)=Pθ{ XW},θΘ(2)
为此检验的势函数。

所以当 θ ∈ Θ 0 \theta\in\Theta_0 θΘ0时,此检验犯第一类错误的概率等于其势函数 β ψ ( θ ) \beta_\psi(\theta) βψ(θ);而当 θ ∈ Θ 1 \theta\in\Theta_1 θΘ1时,检验犯第二类错误的概率等于 1 − β ψ ( θ ) 1-\beta_\psi(\theta) 1βψ(θ)

显著性水平:对于检验 ψ \psi ψ和事先给定的 α ∈ ( 0 , 1 ) \alpha\in(0,1) α(0,1),如果它满足 P θ { X ∈ W } ≤ α , ∀ θ ∈ Θ 0 (3) P_\theta\{\bm X\in W\}\le\alpha, \forall \theta\in\Theta_0\tag3 Pθ{ XW}α,θΘ0(3)
则称 α \alpha α是检验 ψ \psi ψ的显著性水平或水平,也称 ψ \psi ψ为显著性水平 α \alpha α的检验。即检验 ψ \psi ψ犯第一类错误的概率不大于 α \alpha α.

只控制一个检验犯第一类错误的概率时,称这样的检验为显著性检验。一般情况下,求取某假设的显著性检验的步骤如下:

  1. 根据实际问题,建立统计假设 H 0 ↔ H 1 H_0\leftrightarrow H_1 H0H1
  2. 选取一个合适的统计量 T ( X ) T(\bm X) T(X),使当 H 0 H_0 H0成立时, T T T的分布已知,且与参数 θ \theta θ无关(称此分布为统计量 T T T的零分布)
  3. 根据 H 0 H_0 H0 H 1 H_1 H1的特点,确定拒绝域 W W W的区间形式
  4. 对于给定的显著性水平 α \alpha α,确定拒绝域 W W W
  5. 由样本观测值 x \bm x x,计算统计量 T ( X ) T(\bm X) T(X)的值 T ( x ) T(\bm x) T(x),由 T ( x ) T(\bm x) T(x)是否属于 W W W,作出最终判断。

二、单样本正态总体参数的显著性检验

在本节中,始终假设 X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn为来自正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2) I I D IID IID样本,且我们感兴趣的是关于 μ \mu μ σ 2 \sigma^2 σ2的检验问题。

2.1 单样本正态总体均值的检验

方差 假设 检验统计量 拒绝域 名字
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0H1:μ=μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { ∣ U ∣ > u α / 2 } \{\mid U\mid\gt u_{\alpha/2}\} { U>uα/2} 双侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0H1:μ<μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U < − u α } \{U\lt -u_{\alpha}\} { U<uα} 单侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0H1:μ>μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U > u α } \{U\gt u_{\alpha}\} { U>uα} 单侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μμ0H1:μ>μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U > u α } \{U\gt u_{\alpha}\} { U>uα} 单侧 u u u检验
σ 2 = σ 0 2 \sigma^2=\sigma^2_0 σ2=σ02已知 H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μμ0H1:μ<μ0 U = n ( X ‾ − μ 0 ) / σ 0 U=\sqrt n(\overline X-\mu_0)/\sigma_0 U=n (Xμ0)/σ0 { U < − u α } \{U\lt -u_{\alpha}\} { U<uα} 单侧 u u u检验
σ 2 \sigma^2 σ2未知 H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\ne\mu_0 H0:μ=μ0H1:μ=μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { ∣ T ∣ > t α / 2 ( n − 1 ) } \{\mid T\mid\gt t_{\alpha/2}(n-1)\} { T>tα/2(n1)} 双侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ = μ 0 ↔ H 1 : μ < μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μ=μ0H1:μ<μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T < − t α ( n − 1 ) } \{T\lt -t_{\alpha}(n-1)\} { T<tα(n1)} 单侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ = μ 0 ↔ H 1 : μ > μ 0 H_0:\mu=\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μ=μ0H1:μ>μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} { T>tα(n1)} 单侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ ≤ μ 0 ↔ H 1 : μ > μ 0 H_0:\mu\le\mu_0 \leftrightarrow H_1:\mu\gt\mu_0 H0:μμ0H1:μ>μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (Xμ0)/Sn { T > t α ( n − 1 ) } \{T\gt t_{\alpha}(n-1)\} { T>tα(n1)} 单侧 t t t检验
σ 2 \sigma^2 σ2未知 H 0 : μ ≥ μ 0 ↔ H 1 : μ < μ 0 H_0:\mu\ge\mu_0 \leftrightarrow H_1:\mu\lt\mu_0 H0:μμ0H1:μ<μ0 T = n ( X ‾ − μ 0 ) / S n T=\sqrt n(\overline X-\mu_0)/S_n T=n (X
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值