多重假设检验中的误差控制与p值调整
1. 误差控制的基本概念
1.1 保守检验与p值
在多重比较的情境中,保守检验和p值的概念十分重要。保守检验主要是为了防止错误地拒绝原假设,因为在这种检验中,第一类错误(错误地拒绝原假设)的代价被认为大于第二类错误(错误地接受原假设)。这种保守性打破了检验过程的对称性,因为它要求第一类错误率低于整体显著性水平α,而忽略了第二类错误率,这在实践中会导致检验功效的降低。
p值是相对于一组嵌套的拒绝区域{Γ}来定义的。给定统计量T的值t,T = t时的p值为:
[p - value(t) = \min_{
{\Gamma : t \in \Gamma}} P[T \in \Gamma | H = 0]]
这里,符号H = 0表示假设H为真。通常,区域Γ是根据T来定义的。简单来说,p值是在使用区域{Γ}和从收集的数据中得到的阈值对未来数据集进行检验时,错误拒绝H的最低显著性水平,也就是观察到比已收集数据更不符合原假设情况的概率。原则上,它可以针对任何检验区域进行计算。
1.2 多重检验的相关定义
考虑每个参数对应一个假设$H_i$,共有m个参数。定义随机变量$H_i$($i = 1, \cdots, m$)来对应这些假设:
[H_i =
\begin{cases}
0, & \text{如果第i个原假设为真}\
1, & \text{如果第i个原假设为假}
\end{cases}
]
设所有m个假设的索引集为$C = {1, 2, \cdots, m}$,并设$N = {i : H_
超级会员免费看
订阅专栏 解锁全文
5188

被折叠的 条评论
为什么被折叠?



