统计分析中的置换检验、P值与贝叶斯推理
1. 置换检验与P值
传统的统计显著性检验在判断两个样本是否来自同一分布时非常有效,但这些检验需要正确执行,因为许多标准检验存在一些微妙之处,如单边与双边检验、分布假设等问题,正确执行这些检验需要专业的知识和训练。
置换检验则提供了一种更通用且计算简单的方法来确定显著性。如果数据支持你的假设,那么随机打乱的数据集合应该不太可能支持该假设。通过对随机化数据进行多次试验,我们可以确定你所测试的现象有多不寻常。
例如,在研究性别与身高的关系时,我们可以用颜色表示自变量(性别:男性或女性)和因变量(如身高)。原始的结果颜色分布显示男性和女性之间存在明显差异,反映了身高的真实差异。为了确定这种差异的不寻常程度,我们可以通过随机分配性别到原始结果变量来构建一个新的数据集。对每个组进行排序后,我们会发现伪男性/女性的结果分布比原始数据更加平衡,这表明性别确实是决定身高的一个重要因素。经过1000次甚至100万次的试验后,我们会更加坚信这个结论。
置换检验的显著性水平或P值由实际数据的检验统计量在随机排列产生的统计值分布中的排名决定。如果实际值位于分布的极端尾部,则具有高度显著性;如果位于分布的主体部分,则没有显著效果。
在进行置换检验时,需要开发一个能反映你对数据假设的统计量。例如,如果你想确定两个特定变量之间的重要关系,相关系数是一个合理的选择。理想情况下,实际数据中的观测相关性应该比任何随机排列的相关性更强。为了验证性别与身高的关系,我们可以选择男性和女性平均身高的差异作为统计量,并且希望这个差异在实际数据中比大多数随机排列的数据更大。
需要注意的是,在选择统计量时要富有创意,并且最好选择能最小化平
超级会员免费看
订阅专栏 解锁全文
816

被折叠的 条评论
为什么被折叠?



