单个正态总体参数的显著性检验, 它是把样本统计量的观察值与原假设所提供的总体参数作比较, 这种检验要求我们事先能提出合理的参数假设值, 并对参数有某种意义的备择值, 但在实际工作中很难做到这一点, 因而限制了这种方法在实际中的应用.实际中常常选择两个样本, 一个作为处理,一个作为对照, 在两个样本之间作比较. 比如, 要比较某班男生的成绩是否比女生的高, 服用某种维生素的人是否比不服用的人不易感冒, 或判断它们之间是否存在明显显著的差异, 等等。
设总体X与Y独立,XN($\mu_1,\sigma_1^{2}$),YN(μ2,σ22\mu_2,\sigma_2^{2}μ2,σ22)。X1X_{1}X1, X2X_{2}X2,X3X_{3}X3,…,Xn1X_{n1}Xn1是来自总体X的样本,Xˉ\bar{X}Xˉ为其样本均值,S12S_1^{2}S12为其样本方差。Y1Y_{1}Y1, Y2Y_{2}Y2,Y3Y_{3}Y3,…,Yn2Y_{n2}Yn2是来自总体Y的样本,Yˉ\bar{Y}Yˉ为其样本均值,S22S_2^{2}S22为其样本方差。
设两正态总体的方差相等,即σ12\sigma_1^{2}σ12=σ22\sigma_2^{2}σ22=σ2\sigma^2σ2
(1)H0:μ1=μ2<−−−>H1:μ1≠μ2H_0:\mu_1=\mu_2 <---> H_1:\mu_1\neq\mu_2H0:μ1=μ2<−−−>H1:μ1̸=μ2 (双边假设检验)
(2)H0:μ1≤μ2<−−−>H1:μ1>μ2H_0:\mu_1\leq\mu_2 <---> H_1:\mu_1>\mu_2H0:μ1≤μ2<−−−>H1:μ1>μ2 (单边假设检验)
(3)H0:μ1≥μ2<−−−>H1:μ1<μ2H_0:\mu_1\geq\mu_2 <---> H_1:\mu_1<\mu_2H0:μ1≥μ2<−−−>H1:μ1<μ2 (单边假设检验)
这时在H0:μ1=μ2H_0:\mu_1=\mu_2H0:μ1=μ2下可得:
T=(xˉ−yˉ)−(μ1−μ2)(1n1+1n2)s2T=\frac{(\bar{x}-\bar{y})-(\mu_1-\mu_2)}{\sqrt{(\frac{1}{n_1}+\frac{1}{n_2})}s^2}T=(n11+n21)s2(xˉ−yˉ)−(μ1−μ2) ~ t(n1+n2−2)t(n_1+n_2-2)t(n1+n2−2)
例:甲、乙两台机床分别加工某种轴承, 轴承的直径分别服从正态分布N(μ1,σ12\mu_1,\sigma_1^{2}μ1,σ12)和N(μ2,σ22\mu_2,\sigma_2^{2}μ2,σ22), 从各自加工的轴承中分别抽取若干个轴承测其直径。
设μ1=μ2\mu_1=\mu_2μ1=μ2问两台机床的加工精度有无显著差异?(取α=0.05)
总体 | 样本容量 | 直径 |
---|---|---|
X(机床甲) | 8 | 20.5, 19.8, 19.7, 20.4, 20.1, 20.0, 19.0, 19.9 |
Y(机床乙) | 7 | 20.7, 19.8, 19.5, 20.8, 20.4, 19.6, 20.2 |
from scipy.stats import ttest_ind, levene
import pandas as pd
x = [20.5, 19.8, 19.7, 20.4, 20.1, 20.0, 19.0, 19.9]
y = [20.7, 19.8, 19.5, 20.8, 20.4, 19.6, 20.2]
# 方差齐性检验
print(levene(x,y))
# 独立样本T检验,默认方差齐性
print(ttest_ind(x, y))
# 如果方差不齐性,则equal_var=False
print(ttest_ind(x,y,equal_var=False))
print(levene(x,y))
# LeveneResult(statistic=0.49616519174040724, pvalue=0.49361609677338825)
# 检验结果为p>0.05所以,可以认为方差是相等的。
print(ttest_ind(x, y))
# Ttest_indResult(statistic=-0.8548480353442837, pvalue=0.40811369790462515)
# 因为p值=0.4081>0.05, 故接受原假设, 认为两台机床的加工精度无显著差异。