假设检验和AB测试

最新推荐文章于 2025-02-13 18:35:34 发布

Big-brother

最新推荐文章于 2025-02-13 18:35:34 发布

阅读量1k

点赞数

分类专栏：笔记杂文章标签： python Excel github

本文链接：https://blog.youkuaiyun.com/g1027785756/article/details/108005693

版权

笔记杂专栏收录该内容

20 篇文章

订阅专栏

本文深入讲解假设检验的核心概念，包括零假设与备择假设、检验步骤、第一类和第二类错误，以及如何选择合适的α水平。同时，文章探讨了单侧检验与双侧检验的区别，解释了t检验的应用条件，并介绍了cohend系数衡量效应大小的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

注：零假设，又称为虚无假设，一般表述为没有影响、没有效应等。

假设检验的步骤

假设检验的目标是确定一个特定的处理对于总体的作用是否存在。

提出假设，选择 $\alpha$ 水平
定位拒绝域
计算检验统计量
做出决定
当步骤3中的检验统计量位于拒绝域时，拒绝零假设。

假设检验中的不确定性和误差

第一类错误：弃真

在零假设（虚无假设）为真时，拒绝零假设。
发生原因: 在随机选择样本时，可能选择了极端样本，其与假设代表的总体非常不同，即样本含有的信息可能是错误的。
发生的概率: 当研究者在不知情的情况下使用了一个极端、没有代表性的样本时，就会犯第一类错误。但是幸运的是，犯第一类错误的概率很小，并且在研究者的控制中（控制 $\alpha$ 显著水平）犯第一类错误的概率等于 $\alpha$ 显著水平

第二类错误：取伪

发生原因：即使处理对样本存在影响，但是样本均值不在拒绝域时，就会发生第二类错误。一般发生在处理效应比较小的时候，在这种情况下，处理确实影响了样本，但是影响没有足够大到将样本均值移到拒绝域。

假设检验中 $\alpha$ 水平的作用：

（1）确定拒绝域的界限
（2）决定当零假设为真时，犯第一类错误的概率

如何选取合适的 $\alpha$ 水平?

$\alpha$ 应当是一个很小的值 ,根据惯例，最大允许值为0.05。但是也不能太小， $\alpha$ 小了，虽然可以减小犯第一类错误的概率，但同时就需要效应足够强时，才会拒绝零假设。一般，常用的 $\alpha$ 值为0.05,0.01,0.001，它们提供了一个相对小的犯第一类错误的概率并且没有对研究结果有过多严格要求。

报告假设检验的结果

在报告假设检验的结果时，一般不会明确的告诉你研究者用z分数和 $\alpha$ 水平为0.05的检验统计来评价数据，也不会告诉你“拒绝零假设”，一般表述与下面类似：
对顶叶的电刺激对数学测验成绩有显著的作用，z=2.25, p<0.05
几个问题：

什么叫显著？
显著意味着拒绝零假设极不可能由于偶然因素而导致。当零假设为真，极不可能的结果发生时，我们说一个结果显著，或者统计上显著。注意一个效应显著不代表这个效应是大的，显著描述的是一个效应的相对大小，即处理效应引起的差异比由偶然因素引起的差异（标准差）的大小，如Z分数的定义：
$Z=\frac{M-\mu}{\sigma}$
z=2.25什么意思？
z表示z分数作为检验统计量，被用来评价样本数据，它的值为2.25。
p<0.05什么意思？
0.05为显著性水平 $\alpha$ ，
$p=P(结果发生| H_0为真)$
因此当p<0.05（说明在原假设成立的情况下，根据实际样本计算出来的统计量落在了拒绝域）时拒绝零假设。

用于假设检验的数学知识基于一系列前提，当这些前提被满足时，你能确定产生的结果是合理的。但是，如果这些前提不能被满足，假设检验效果可能被折中。在实践中，研究者不会过于关注假设检验的前提，因为即使违背这些前提，检验也可以进行的很好。

单侧检验和双侧检验

单侧检验和双侧检验的主要区别是它们拒绝零假设的标准不一样。双侧检验需要更多的证据来拒绝零假设，因为双侧检验时，拒绝域处在概率分布的两端，拒绝域的边界离总体均值更远，因此需要更多的证据来拒绝虚无假设。单侧假设的拒绝域集中在概率分布的一端，拒绝域边界离总体均值较近。因此一个相对较小的处理效应可能单侧检验显著但是双侧检验不显著。

什么时候用单侧检验，什么时候用双侧检验？
备择假设没有特定的方向性，形式为“≠”的检验假设要用双侧检验；
备择假设带有特定的方向性，形式为“>”或“<”的检验假设要用单侧检验。

检验统计量

常用的检验统计量
使用 t 检验的两个条件：

小样本（n<30）
$\sigma$ 未知
t值的计算公式为：
$t=\frac{M-\mu}{s/\sqrt{n}},M为样本均值，\mu为总体均值，s为样本标准差，n为样本中个体的数量$
注：标准差与标准误：标注差为总体分布的标准差，标准误为样本均值分布的标准差，计算公式为 $\sigma_m=\frac{\sigma}{\sqrt{n}}$ 。当总体标准差未知时，可以使用估计标准误 $s_m=\frac{s}{\sqrt{n}}$ 。