显著性水平与ppp值的区别
1、定义
显著性水平:所能接受的发生第一类错误的最大概率
ppp值:由检验统计量的样本观察值得出的原假设可被拒绝的最小显著性水平
分析:显著性水平越小则原假设更难被拒绝,接受域更大(极端情况α→0\alpha\to 0α→0则原假设必然被接受而无法被拒绝);而ppp值可以理解为当原假设为真时,比得到的样本观察值结果更极端的结果出现的概率,故当ppp值越小时,表明出现样本及比此时样本值更极端的概率越小,说明此时抽取的样本本身是极端的,由小概率事件定理可以充分的拒绝原假设,故当ppp值越小时更容易拒绝原假设。
2、计算步骤
设总体X∼N(μ,σ2)X\sim N(\mu,\sigma ^2)X∼N(μ,σ2),μ\muμ未知,σ2=100\sigma ^2=100σ2=100,现有样本x1,x2,…,x52x_1,x_2,\dots,x_{52}x1,x2,…,x52,算得xˉ=62.75\bar{x}=62.75xˉ=62.75现在检验假设
H0:μ≤μ0=60,H1:μ>μ0=60H_0:\mu\leq\mu_0=60,\quad H_1:\mu>\mu_0=60H0:μ≤μ0=60,H1:μ>μ0=60
- 临界值法:(α=0.05\alpha=0.05α=0.05)
由μ\muμ未知,σ2\sigma^2σ2已知得采用UUU检验
故令U=X‾−μσ/n∼N(0,1)U=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)U=σ/nX−μ∼N(0,1),则P{U≥u1−α}<αP\{U\ge u_{1-\alpha}\}<\alphaP{U≥u1−α}<α,即此时拒绝域为U≥u1−αU\ge u_{1-\alpha}U≥u1−α
而u=x‾−μ0σ/n=62.75−6010/52=1.983u=\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}=\frac{62.75-60}{10/\sqrt{52}}=1.983u=σ/nx−μ0=10/5262.75−60=1.983而u0.95=1.645≤uu_{0.95}=1.645\leq uu0.95=1.645≤u故落入拒绝域,即在显著性水平为0.05时拒绝原假设,即μ>μ0=60\mu>\mu_0=60μ>μ0=60 - ppp值法:(α=0.05\alpha=0.05α=0.05)
采用ZZZ检验法,故令Z=X‾−μσ/n∼N(0,1)Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)Z=σ/nX−μ∼N(0,1)代入样本值得z=62.75−6010/52=1.983z=\frac{62.75-60}{10/\sqrt{52}}=1.983z=10/5262.75−60=1.983
故p=P{Z≥z}=P{Z≥1.983}=1−Φ(1.983)=0.0238p=P\{Z\geq z\}=P\{Z\geq1.983\}=1-\Phi(1.983)=0.0238p=P{Z≥z}=P{Z≥1.983}=1−Φ(1.983)=0.0238
上式计算p值的过程充分地展示了ppp值可以理解为当原假设为真时,比得到的样本本身或观察值结果更极端的结果出现的概率的原因,在这里更极端可以理解为μ\muμ愈来愈大于μ0\mu_0μ0,同时比zzz更极端,也即P{Z>z}=P{Z≥1.983}P\{Z>z\}=P\{Z\geq1.983\}P{Z>z}=P{Z≥1.983}
通过图形分析,当α>p\alpha>pα>p时ppp会落入拒绝域,而当α<p\alpha < pα<p时ppp未落入拒绝域,因此在该问题中应当拒绝原假设故在显著性水平为0.05时拒绝原假设,即μ>μ0=60\mu>\mu_0=60μ>μ0=60

3、区别
- 由上面的步骤易得显著性水平α\alphaα是人为给定的是主观的是可以变动的,而ppp值是由样本值和总体分布计算得出相较而言更客观更加的固定。
- ppp值另一定义:由检验统计量的样本观察值得出的原假设可被拒绝的最小显著性水平,要拒绝原假设便要使得α>p\alpha>pα>p,因此在拒绝原假设的情形中ppp是α\alphaα变动的下界,在上题中α=0.03,0.04\alpha=0.03,0.04α=0.03,0.04等大于0.0238的数值都可以得到拒绝原假设的结论,当α=0.01\alpha=0.01α=0.01时,此时便可接受原假设,但同时接受域也变大,更容易接受。
- 在采用ppp值法时可以得到更多关于拒绝域的信息,更加精确,也即是ppp作为最小显著性水平所决定的。
本文详细解析了显著性水平和p值的区别,包括定义上的对照、计算步骤演示,以及它们在统计推断中的作用。显著性水平是预设的概率,而p值反映实际观察结果的极端性。通过实例比较,展示了如何在不同方法下判断原假设。

被折叠的 条评论
为什么被折叠?



