1 前言
读曼昆的经济学原理的时候,印象最深刻的一句话是:People face trade-offs, the cost of something is what you give up to get it. 简单来说就是事物都有成本,每个选择都面临取舍。这句话在生产环境中尤为合适。当研发新药的时候,当金融机构对策略进行分析的时候,当判断系统某个新功能是否有效的时候,在一切需要假设检验的地方,就会面临检验样本量的选择。样本量太小,则检验的可信度不高,没有说服力;样本量太大,则成本过高,不可取。在这种情况下,如何选择使样本有代表性、使检验有效的最小样本量变得尤其重要。
2 过程介绍
开始之前先回顾一下假设检验的基础概念。类似于反证法,通常我们将想要拒绝的假设(比如实验组与对照组无差异)设为原假设(H0),想要证明的假设(双边:实验组与对照组显著不同;单边:实验组明显优于/劣于对照组)设为备择假设(H1)。实验目的为推翻原假设。
犯第一类错误(拒真)的概率为α,也叫做显著性水平;第二类错误(受伪)的概率为β。则检验功效(power of effect)为1-β,也就是当原假设为假时,正确拒绝原假设的概率。
此外,检验效应量(effect size)是衡量效应大小的指标,可以用来反映具有显著差异的研究结果是否具有实际意义或重要性。它通常是均值的组间差值或标准化差值,比率的组间差值或比值(RR、HR)、OR,或相关系数、回归系数等。由于效应量是事后的概念,而最小样本量选取是事前的概念,因此