假设检验
1、概述
假设检验分为参数假设检验和非参数假设检验,参数假设检验是对总体分布函数中的未知参数提出某种假设,然后利用样本提供的信息对所提出的假设进行检验,根据检验的结果对所提出的假设做出拒绝或接受的判断。
非参数假设检验是对总体分布函数的形式或总体的性质提出某种假设进行的检验。
1.1 假设检验的基本思想与基本概念
例3.1.1 某车间生产的滚球直径服从正态分布
N
(
15.1
,
0.05
)
N(15.1,0.05)
N(15.1,0.05)。现从今天生产的滚球中随机抽取6个,测得的直径为
14.6
,
15.1
,
14.9
,
14.8
,
15.2
,
15.1
14.6, 15.1, 14.9, 14.8, 15.2, 15.1
14.6,15.1,14.9,14.8,15.2,15.1
假定方差不变,问今天生产的滚球是否符合要求?即是否可以认为今天生产的滚球的平均直径为15.1?
分析:
- 第一步:提出原假设和备择假设
记原始正态分布的均值和方差为 a 0 = 15.1 , σ 2 = 0.05 a_0=15.1, \sigma^2=0.05 a0=15.1,σ2=0.05今天生产的滚球直径 ξ ∼ N ( a , 0.05 ) \xi\sim N(a,0.05) ξ∼N(a,0.05),我们所要回答的问题是 a = a 0 ? a=a_0? a=a0?吗?
我们可以假设 a = a 0 a=a_0 a=a0,并称假设 a = a 0 a=a_0 a=a0为原假设或零假设,记为:
H 0 : a = a 0 (1) H_0: a=a_0\tag{1} H0:a=a0(1)
这种原假设可能成立也可能不成立。当原假设不成立时,称 a a a的取值为备选假设,本例取 " a ≠ a 0 " "a\neq a_0" "a=a0"为备选假设,记为
H 1 : a ≠ a 0 H_1:a\neq a_0 H1:a=a0 - 第二步:构造检验量
如果原假设 H 0 H_0 H0成立?可得到 a = a 0 a=a_0 a=a0, 因为 ξ ˉ 是 a 的 有 效 估 计 \bar\xi是a的有效估计 ξˉ是a的有效估计. 则可以得到 ξ ˉ \bar\xi ξˉ应该与 a 0 a_0 a0很靠近,即 ∥ ξ ˉ − a 0 ∥ \|\bar\xi-a_0\| ∥ξˉ−a0∥应该很小, 否则, 就不能认为 H 0 H_0 H0成立.
我们构造的检验量:
当 ∥ ξ ˉ − a 0 ∥ > C 时 , 我 们 拒 绝 H 0 (2) 当\|\bar\xi-a_0\|>C时, 我们拒绝H_0\tag{2} 当∥ξˉ−a0∥>C时,我们拒绝H0(2)
当 ∥ ξ ˉ − a 0 ∥ ≤ C 时 , 我 们 不 能 拒 绝 H 0 当\|\bar\xi-a_0\|\leq C时,我们不能拒绝H_0 当∥ξˉ−a0∥≤C时,我们不能拒绝H0 - 第三步: 确定拒绝域
我们选择 C = C 0 C=C_0 C=C0, 则 H 0 H_0 H0的拒绝域为(记为 χ 0 \chi_0 χ0)
χ 0 = ∣ ξ ˉ − a 0 ∣ > C 0 ⇒ ∣ U ∣ > n C 0 σ 0 \begin{aligned} \chi_0&={|\bar\xi-a_0|>C_0}\\ &\Rightarrow|U|>\frac{\sqrt{n}C_0}{\sigma_0} \end{aligned} χ0=∣ξˉ−a0∣>C0⇒∣U∣>σ0nC0
其中, U = ξ ˉ − a 0 σ 0 / n ∼ N ( 0 , 1 ) U=\frac{\bar\xi-a_0}{\sigma_0/\sqrt{n}}\sim N(0,1) U=σ0/nξˉ−a0∼N(0,1)
说明: ξ ∼ N ( a 0 , σ 0 2 ) \xi\sim N(a_0,\sigma_0^2) ξ∼N(a0,σ02), 则 ξ ˉ ∼ N ( a 0 , σ 0 2 / n ) \bar\xi\sim N(a_0, \sigma_0^2/n) ξˉ∼N(a0,σ02/n)
由于公式(1)和公式(2):
α = P { 拒 绝 H 0 ∣ H 0 为 真 } = P 0 { ∥ ξ ˉ − a ∥ > C ∣ a = a 0 } = P 0 { ∥ U ∥ > n C σ 0 } = 2 [ 1 − Φ ( n C σ 0 ) ] \begin{aligned} \alpha&=P\{拒绝H_0|H_0为真\}\\ &=P_0\{\|\bar\xi-a\|>C|a=a_0\}\\ &=P_0\{\|U\|>\frac{\sqrt nC}{\sigma_0}\}\\ &=2[1-\Phi(\frac{\sqrt nC}{\sigma_0})] \end{aligned} α=P{拒绝H0∣H0为真}=P0{∥ξˉ−a∥>C∣a=a0}=P0{∥U∥>σ0nC}=2[1−Φ(σ0nC)]
可得出:
Φ ( n C σ 0 ) = 1 − α 2 \Phi(\frac{\sqrt nC}{\sigma _0})=1-\frac{\alpha}{2} Φ(σ0nC)=1−2α
其中 Φ ( x ) \Phi(x) Φ(x)为标准正态分布函数, 因为 α \alpha α为已知数, 所以查标准正态分布函数表, 可得其下侧 1 − α / 2 1-\alpha/2 1−α/2分位数 u 1 − α 2 u_{1-\frac{\alpha}{2}} u1−2α, 使得
Φ ( u 1 − α 2 ) = 1 − α 2 \Phi(u_{1-\frac{\alpha}{2}})=1-\frac{\alpha}{2} Φ(u1−2α)=1−2α
从而:
n C σ 0 = u 1 − α 2 \frac{\sqrt nC}{\sigma_0}=u_{1-\frac{\alpha}{2}} σ0nC=u1−2α
故:
C = σ 0 u 1 − α 2 n C=\frac{\sigma_0u_{1-\frac{\alpha}{2}}}{\sqrt n} C=nσ0u1−2α
于是得到拒绝域:
χ 0 = { ∥ ξ ˉ − a 0 ∥ > σ 0 u 1 − α 2 n } = { ∥ ξ ˉ − a 0 σ 0 / n ∥ > u 1 − α / 2 } (3) \begin{aligned} \chi_0&=\{\|\bar\xi-a_0\|>\frac{\sigma_0u_{1-\frac{\alpha}{2}}}{\sqrt n}\}\\ &=\{\|\frac{\bar\xi-a_0}{\sigma_0/\sqrt n}\|>u_{1-\alpha/2}\} \end{aligned}\tag{3} χ0={∥ξˉ−a0∥>nσ0u1−2α}={∥σ0/nξˉ−a0∥>u1−α/2}(3) - 第四步: 带入数值计算,判断是否拒绝.
例子中, a 0 = 15.1 , ξ ˉ = 14.95 , σ 0 = 0.05 , n = 6 , 取 α = 0.05 , u 1 − α / 2 = 1.96 a_0=15.1, \bar\xi=14.95, \sigma_0=0.05, n=6, 取\alpha=0.05, u_{1-\alpha/2}=1.96 a0=15.1,ξˉ=14.95,σ0=0.05,n=6,取α=0.05,u1−α/2=1.96带入公式(3)可得:
∥ ξ ˉ − a 0 σ 0 / n ∥ = ∥ 14.95 − 15.1 0.05 / 6 ∥ = 1.64317 < 1.96 = u 1 − α / 2 \begin{aligned} \|\frac{\bar\xi-a_0}{\sigma_0/\sqrt n}\|&=\|\frac{14.95-15.1}{0.05/\sqrt 6}\|\\ &=1.64317<1.96=u_{1-\alpha/2} \end{aligned} ∥σ0/nξˉ−a0∥=∥0.05/614.95−15.1∥=1.64317<1.96=u1−α/2
在拒绝域之外, 所以不拒绝 H 0 H_0 H0, 即认为这天生产的滚球平均直径为15.1
一类错误和二类错误
α
=
P
{
犯
第
一
类
错
误
}
=
P
{
拒
绝
H
0
∣
H
0
为
真
}
β
=
P
{
犯
第
二
类
错
误
=
P
{
接
受
H
0
∣
H
0
为
假
}
}
\alpha=P\{犯第一类错误\}=P\{拒绝H_0|H_0为真\}\\ \beta=P\{犯第二类错误=P\{接受H_0|H_0为假\}\}
α=P{犯第一类错误}=P{拒绝H0∣H0为真}β=P{犯第二类错误=P{接受H0∣H0为假}}
我们当然希望两种错误的概率
α
和
β
\alpha和\beta
α和β都尽可能的小, 最好都为0. 但是当样本容量n固定时, 要使
α
,
β
\alpha, \beta
α,β同时变小是不可能的. 当
α
\alpha
α变小时, 意味着接受域变大, 这将导致
β
\beta
β变大;反之,当
β
\beta
β变小时, 意味着否定域变小, 这又导致
α
\alpha
α变小.
在实际问题中,通常的做法是,先限制犯第一类错误的概率
α
\alpha
α, 即根据实际情况, 指定一个较小的数(如0.05, 0.01, 0.001等)作为
α
\alpha
α的值, 有了
α
\alpha
α的值就可以确定上述的C. 从而可确定拒绝域. 然后再利用备选假设
β
\beta
β的值, 如果
β
\beta
β的值太大, 则需增大样本容量n使
β
\beta
β变小. 如果实际情况不需要
β
\beta
β太小,则可考虑适当减小n, 以节省人力, 物力和时间.