假设检验、抽样理论与统计分析
1. 假设检验与P值解读
在假设检验中,原假设 (H_0) 和备择假设 (H_1) 是核心概念。当原假设 (H_0) 为真时,检验统计量 (T) 取值的概率由实线曲线下的面积描述;当备择假设 (H_1) 为真时,(T) 取值的概率由虚线曲线下的面积描述。
假设我们抽取了一个样本并计算出检验统计量 (T_0)。若 (H_0) 为真,深灰色阴影区域就是P值;若 (H_1) 为真,看到像 (T_0) 这么大或更大的检验统计量的概率是浅灰色阴影区域和深灰色阴影区域之和,显然这个概率比P值大很多。
P值的大小可以帮助我们判断是否有足够的证据拒绝原假设,以下是P值的解读规则:
- 若P值大于0.1,则说“没有证据反对 (H_0)”。
- 若P值在0.05和0.1之间,则说“有微弱证据反对 (H_0)”。
- 若P值在0.01和0.05之间,则说“有证据反对 (H_0)”。
- 若P值在0.001和0.01之间,则说“有强证据反对 (H_0)”。
- 若P值小于0.001,则说“有非常强的证据反对 (H_0)”。
2. 置信区间
置信区间用于量化估计中的不确定性,它以一个范围和相关的置信水平来表示。例如,“我们对穿12码鞋子的男性平均脚长的估计是305毫米,这个估计的95%置信区间是297毫米到313毫米”。需要注意的是,置信水平(如95%)是关于置信区间随机性质的陈述,不能被解释为概率。
2.1 假设检验与置信区间的关系
双尾假设检验和置信区间之间存在联系。双尾假设检验的备择假设没有方向,通常形式为 (H_1 : θ ≠ θ_