Wald检验与p值

这篇博客详细解释了Wald检验的原理,如何利用θ^的渐近正态性检验H0: θ=θ0,通过计算W统计量并比较zα/2来决定是否拒绝原假设。它还介绍了显著性水平和Power Function的概念,并展示了如何计算p-value。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Wald检验

检验H0:θ=θ0, H1:θ≠θ0H_0:\theta = \theta_0, \ H_1:\theta \ne\theta_0H0:θ=θ0, H1:θ=θ0,如若θ^\hat{\theta}θ^是渐进正态的,则显著水平为α\alphaα的Wald检验是当∣W∣>zα/2|W|>z_{\alpha/2}W>zα/2时拒绝原假设,其中W=θ^−θ0se^.W=\frac{\hat{\theta}-\theta_0}{\hat{se}}.W=se^θ^θ0.

Wald检验是易于理解的,首先阐述了估计量是渐进正态的,则在大样本下WWW就是标准正态变量,当满足∣W∣>zα/2|W|>z_{\alpha/2}W>zα/2意味着W出现的概率已经小于α\alphaα. 这一点可以通过下面的等式说明:
zα=Φ(1−α)Pθ(θ^−θ0se^>zα/2)+Pθ(θ^−θ0se^<−zα/2)=Pθ(∣θ^−θ0∣se^>zα/2)→Pθ(∣Z∣>zα/2)→α \begin{aligned} &z_{\alpha}=\Phi(1- \alpha)\\ &P_\theta(\frac{\hat{\theta}-\theta_0}{\hat{se}}>z_{\alpha/2})+ P_\theta(\frac{\hat{\theta}-\theta_0}{\hat{se}}<-z_{\alpha/2}) \\ &=P_\theta(\frac{|\hat{\theta}-\theta_0|}{\hat{se}}>z_{\alpha/2})\\ &\rightarrow P_\theta(|Z|>z_{\alpha/2})\\ &\rightarrow \alpha \end{aligned} zα=Φ(1α)Pθ(se^θ^θ0>zα/2)+Pθ(se^θ^θ0<zα/2)=Pθ(se^θ^θ0>zα/2)Pθ(Z>zα/2)α
定理:考虑θ\thetaθ的真实值为θ∗≠θ0\theta^* \ne \theta_0θ=θ0,也就是原假设为加的时候的势函数(Power Function)大小,其近似值为:1−Φ(θ0−θ∗se^+zα/2)+Φ(θ0−θ∗se^−zα/2)1-\Phi(\frac{\theta_0-\theta^*}{\hat{se}}+z_{\alpha/2})+\Phi(\frac{\theta_0-\theta^*}{\hat{se}}-z_{\alpha/2})1Φ(se^θ0θ+zα/2)+Φ(se^θ0θzα/2)
Proof:
β(θ∗)=Pθ∗(∣θ^−θ0se^∣>zα/2)=Pθ∗(θ^−θ0se^>zα/2)+Pθ∗(θ^−θ0se^<−zα/2) \begin{aligned} \beta(\theta^*) &= P_{\theta^*}(|\frac{\hat{\theta}-\theta_0}{\hat{se}}| >z_{\alpha/2})\\ &=P_{\theta^*}(\frac{\hat{\theta}-\theta_0}{\hat{se}} >z_{\alpha/2})+P_{\theta^*}(\frac{\hat{\theta}-\theta_0}{\hat{se}} <-z_{\alpha/2}) \end{aligned} β(θ)=Pθ(se^θ^θ0>zα/2)=Pθ(se^θ^θ0>zα/2)+Pθ(se^θ^θ0<zα/2)为了方便起见,先考虑第一部分,第二部分的方法类似:
β(θ∗)=Pθ∗(θ^−θ0se^>zα/2)=Pθ∗(θ^>θ0+se^zα/2)=Pθ∗(θ^−θ∗>θ0−θ∗+se^zα/2)=Pθ∗(θ^−θ∗se^>θ0−θ∗+se^zα/2se^)=Pθ∗(θ^−θ∗se^>θ0−θ∗se^−zα/2)≈Pθ∗(Z>θ0−θ∗se^−zα/2)=1−Φ(θ0−θ∗se^−zα/2) \begin{aligned} \beta(\theta^*) &=P_{\theta^*}(\frac{\hat{\theta}-\theta_0}{\hat{se}} >z_{\alpha/2})\\ &=P_{\theta^*}(\hat{\theta}>\theta_0+\hat{se} z_{\alpha/2})\\ &=P_{\theta^*}(\hat{\theta}-\theta^*>\theta_0-\theta^*+\hat{se} z_{\alpha/2})\\ &=P_{\theta^*}(\frac{\hat{\theta}-\theta^*}{\hat{se}}>\frac{\theta_0-\theta^*+\hat{se} z_{\alpha/2}}{\hat{se}})\\ &=P_{\theta^*}(\frac{\hat{\theta}-\theta^*}{\hat{se}}>\frac{\theta_0-\theta^*}{\hat{se}}-z_{\alpha/2})\\ &\approx P_{\theta^*}(Z>\frac{\theta_0-\theta^*}{\hat{se}}-z_{\alpha/2})\\ &=1-\Phi(\frac{\theta_0-\theta^*}{\hat{se}}-z_{\alpha/2}) \end{aligned}\\ β(θ)=Pθ(se^θ^θ0>zα/2)=Pθ(θ^>θ0+se^zα/2)=Pθ(θ^θ>θ0θ+se^zα/2)=Pθ(se^θ^θ>se^θ0θ+se^zα/2)=Pθ(se^θ^θ>se^θ0θzα/2)Pθ(Z>se^θ0θzα/2)=1Φ(se^θ0θzα/2)

p值

对于任意α∈(0,1)\alpha \in(0,1)α(0,1),存在显著性水平为α\alphaα的检验,对应的拒绝域为RαR_\alphaRα,则p−value=inf⁡{α:T(Xn)∈Rα}p-value = \inf\{\alpha:T(X^n)\in R_\alpha \}pvalue=inf{α:T(Xn)Rα}
这里TTT表示检验统计量,上式的含义是使得检验统计量属于拒绝域的最小显著水平α\alphaα

和检验的过程不同,求取p-value的过程是这样的:先计算检验统计量,得到统计量之后反过来求最小显著水平。而检验的过程是已经确定一个显著水平,然后计算检验统计量,然后就确定是否拒绝原假设。

一般来说,这个最小显著水平p-value小于0.01时,说明证据可以很强的拒绝原假设。这等同于说,在原假设的情况下,出现这一组样本的概率可能最低达到0.01.(个人理解)当显著水平大于0.1时,不能拒绝原假设。

<think>嗯,用户想了解Wald检验的相关信息和使用方法。首先,我需要回顾一下Wald检验的基本概念。Wald检验是一种统计检验方法,用于评估模型参数的显著性。通常在回归分析中使用,比如逻辑回归或者线性回归,检验某个自变量对因变量的影响是否显著。 根据用户提供的引用,特别是引用[1]和[2],Wald检验在R语言中的应用是通过比较回归系数其标准误的比,计算统计量,通常是z或t,进而得到p。如果p小于显著性水平(比如0.05),就拒绝原假设,认为该系数显著不为零。例如,在逻辑回归中,检查某个变量是否应该保留在模型中。 接下来,用户可能需要具体的步骤和示例。根据引用[2]中的示例代码,使用R的survey包中的regTermTest函数来进行Wald检验。例如,检验逻辑回归模型中的"ForeignWorker"变量是否显著。结果中的p为0.33027,说明不显著,而"CreditHistory.Critical"的p很小,说明显著。这展示了如何在实际操作中应用Wald检验。 另外,用户可能对Wald检验其他检验(如似然比检验、卡方检验)的区别感兴趣。根据引用[3]和[4],卡方检验用于特征选择中的相关性评估,而方差分析(F检验)用于多组均差异的检验。需要解释Wald检验这些方法的不同之处,比如Wald检验基于参数的估计和标准误,而似然比检验比较嵌套模型的似然函数。 还要注意用户提到的系统级指令,比如数学公式的格式。例如,Wald统计量的公式应写成$W = (\hat{\beta}/SE(\hat{\beta}))^2$,用$...$包裹。独立公式则用$$...$$,如卡方分布的公式。 最后,生成相关问题,帮助用户进一步学习。可能的问题包括Wald检验的假设条件、其他检验的比较、处理多重共线性的影响等。这些需要基于已有引用和一般统计学知识来构思。 总结回答结构:先定义Wald检验,解释原理,步骤,R语言示例,其他检验的区别,最后相关问题。确保所有数学表达式格式正确,引用适当的位置添加标识,比如引用[^1]和[^2]。</think>### Wald检验详解 #### 一、定义核心原理 Wald检验是统计学中用于**检验单个参数或线性组合参数的显著性**的方法。其核心思想基于参数估计$\hat{\beta}$标准误$SE(\hat{\beta})$的比构建统计量: $$ W = \left( \frac{\hat{\beta}}{SE(\hat{\beta})} \right)^2 \sim \chi^2(1) $$ 当$W$超过临界或对应p小于显著性水平(如0.05)时,拒绝原假设$H_0: \beta=0$,即认为该参数显著[^1][^2]。 #### 二、使用步骤(以逻辑回归为例) 1. **拟合模型**:通过最大似然估计获取参数$\hat{\beta}$及其标准误 2. **构建统计量**:计算$W$ 3. **假设检验**:对比$\chi^2$分布或正态分布确定p 4. **决策**:若p<0.05,拒绝原假设,保留该变量 #### 三、R语言实现示例 ```r # 引用survey包进行Wald检验 library(survey) # 示例1:检验"ForeignWorker"变量的显著性 regTermTest(mod_fit_one, "ForeignWorker") # 输出:F=0.949, p=0.33027 → 不显著 # 示例2:检验"CreditHistory.Critical"的显著性 regTermTest(mod_fit_one, "CreditHistory.Critical") # 输出:F=16.678, p=5.0357e-05 → 显著 ``` #### 四、其他检验的对比 | 检验类型 | 核心原理 | 适用场景 | |----------------|-----------------------------------|--------------------------| | Wald检验 | 基于参数估计的渐近分布 | 单个/线性组合参数检验 | | 似然比检验(LRT)| 比较嵌套模型的对数似然差 | 复杂模型比较 | | 卡方检验 | 观测频数期望频数的偏差 | 分类变量独立性检验[^3] | | F检验 | 组间方差组内方差的比 | 多组均差异检验[^4] | #### 五、注意事项 1. **样本量敏感性**:小样本时Wald检验可能低估方差,导致Type I错误率升高 2. **多重共线性影响**:高度相关的变量会增大标准误,降低检验效力 3. **非线性组合检验**:需通过矩阵变换实现多参数联合检验
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值