使用Python scipy做统计检验--Student t-test

最新推荐文章于 2024-09-08 08:06:01 发布

原创

最新推荐文章于 2024-09-08 08:06:01 发布 · 2.6w 阅读

39 ·

CC 4.0 BY-SA版权

文章标签：

#数理统计 #假设检验

本文通过一个实例介绍如何使用Python的scipy库进行Student t检验，比较两种作物产量是否存在显著差异。首先，通过scipy的ttest_ind_from_stats方法直接计算假设检验，然后手动推导t值和p-value，验证了scipy计算结果的准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我们使用下面的一个简单的例子来熟悉Student t检验的方法。

在10块地上同时种植甲乙两种作物，其产量服从正态分布，并且方差相同。结果计算得 $\overline{x}=30.97, \overline{y}=21.79, S_x = 26.7, S_y = 12.1$ 。试问这两种作物的产量有无明显差异？

这是一个典型的双样本，正态同方差的假设检验，判断两个正态分布的期望是否相同。 $H_0: \mu_1 = \mu_2, H_1: \mu_1 \neq \mu_2$ 。

使用scipy直接做假设检验

Scipy提供了两个方法解决双样本同方差的Student t-test问题：
1. scipy.stats.ttest_ind
2. scipy.stats.ttest_ind_from_stats
第一个方法要求输入原始样本数据，第二个方法直接输入样本的描述统计量（均值，标准差，样本数）即可。那么这里我们直接使用第二方法。

需要注意的是，Scipy.stats库函数要求输入的样本标准差是总体标准差的无偏统计量，也就是我们常说的“修正样本方差”和“修正样本标准差”。