Introduction
在做多重比较(multiple comparison)时,由于要在同一个数据集上检验多个结论,会导致犯第一类错误的概率大大增加。假设只做一次检验时的显著性水平为0.05,即接受备择假设的允许犯错概率为5%,那么保留原假设的犯错概率就是95%. 如果在同一个数据集上做了n次独立检验,那么n次都不犯第一类错误的概率是(0.95)^n,于是这n次中至少有一次犯了第一类错误的概率是1-(0.95)^n. 当n增大时,显然1-(0.95)^n也会增大,例如当n=10,1-(0.95)^10=0.40(约等于), 即对同一数据集做10次检验假设的犯错概率上升为40%,远远大于实际可以忍受的5%的犯错概率。
Methods
(1)Bonferronni校正
α'≈α/c;
在这一修正下,单次检验的显著性水平设定为总体的显著性水平(如0.05)的1/n (如n=10,则单次检验的接受概率变为0.005)。在各次检验独立的情况下。Bonferroni修正实际上是更一般的Sidak修正的Taylor展开式的第一项,因而更保。Bonferroni correction 在概率论上的一个理论基础是Boole's inequality, 即布尔不等式。这是说,假定一些事件组成了一个可数的集合,那么这集合中的至