摘要: 统计检验能有效确定从样本统计推断至总体时所犯错误的概率,其在医学、临床试验。观察性研究方面有着重要意义。近年来期刊编辑和统计顾问越来越关注医学文献中显着性检验和P值的过度使用和误解。为了澄清对统计学检验和P值的误解和误用,本文通过回顾P值相关理论,总结了P值的优势和劣势,强调了P值在使用中应注意的问题,旨在使非统计专业人员避免对P值的误解和误用。
关键词 : P值;假设检验;置信区间
1 引言
为了确定从样本统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检验。通过把所得到的统计检验定值,与统计学家建立了一些随机变量的概率分布进行比较,我们可以知道在多少百分比的机会下会得到目前的结果。然而,期刊编辑和统计顾问越来越关注医学文献中显着性检验和P值的过度使用和误解。正如美国统计协会最近发表的论文所总结的那样,P值除了具有优势外,还存在固有的弱点。
为了澄清,扩展和完善了统计指南,以便作者涵盖临床试验和观察性研究。新指南讨论了《日刊》研究报告的许多方面,包括用效应或关联的估计值代替P值的要求,以及当协议和统计分析计划都没有指定用于调整乘数的方法时95%置信区间的要求。本文通过回顾 P值相关理论,解读了P值的含义以及在假设检验中应注意的问题,旨在使非统计专业人员避免对 P 值的误解和误用。
2 P值相关理论
P 的含义是指从H0规定的总体中随机抽样,抽得等于及大于或等于及小于现有样本获得的检验统计量的概率。P值理论归功于现代统计学之父、英国统计学家Ronald A. Fisher,Fisher 基于1908年Student的t分布理论,于1925 年首次给出不同情形下P值的计算方法。P 值提供的是度量实际数据与无效假设不相容的证据,P 值越小,越有理由拒绝无效假设。Fisher 认为这是建立科学事实的唯一实验依据,并提出使用后来饱受诟病的“显著”一词来描述该结论,P 值理论由此得名显著性检验。Fisher提示研究者应尽可能重复实验,如果重复实验仍然得到较小的 P 值,则可以推论观察到的效应不大可能单纯由于偶然造成。所以“显著”本意是值得研究者关注或进行重复实验

本文探讨了统计学中的P值及其在假设检验中的应用,强调了P值的含义、优缺点以及在医学文献中被过度使用和误解的问题。文章提醒非统计专业人员避免对P值的误解,指出P值不应被视为判断科学事实的唯一依据,而应结合其他证据和研究背景。同时,建议研究者综合使用多种统计方法,如效应值和置信区间,以更全面地解释研究结果。
订阅专栏 解锁全文
3179

被折叠的 条评论
为什么被折叠?



