统计概念
配对样本均数t检验
p值、pFDR和q值p值相关单个假设检验中主要依靠p值(或统计量t)做出是否拒绝零假设H0的决定:p值和预先设定的检验水准alpha做对比,如果p值小于等于alpha,拒绝原假设,否则不拒绝原假设。
p值:表征了在原假设成立的条件下,重复进行当前的试验,获得现有统计量t及其更极端情况的概率。
给定检验水准alpha时,可得出对应的拒绝域;根据当前试验,可以计算出p值。当p值越小时,表示此时试验得到的统计量t越落在拒绝域。因此基于p值的结果等价于基于t值的结果。因此,p值越小,拒绝原假设的信心越大。
假阳性率:false positive rate, FPR.检验水准alpha给出了事先犯I-型错误的最大概率。
多重假设检验和总体错误率在进行多重假设检验时,每个单独的假设都具有其本身的I型错误。在这种情况下,如果不进行任何的控制,犯I-型错误的概率会随着假设检验的个数而迅速增加。
多重假设检验中,广泛使用的错误控制指标是总体错误率(family-wise error rate,FWER),即至少出现一次错误地拒绝真实H0的可能性;FWER小于等于alpha。而研究者更关心的是能否尽量多地识别出差异表达的基因,并且能够容忍和允许总的拒绝中发生少量的错误识别,称为错误发现false discovery。即需要在错误发现和总的拒绝次数R之间寻找一种平衡