t检验
如果变量是类别型的,那么可以直接使用7.3节中的显著性检验的方法。结果变量为连续型的组间,并假设其呈正态分布,则需要使用这节的方法。
数据准备
MASS 包中的 UScrime 数据集,包含了1960年美国47个州的刑罚制度对犯罪率影响的信息。感兴趣的变量:
Prob (监禁的概率)、
U1 (14~24岁年龄段城市男性失业率)
U2 (35~39岁年龄段城市男性失业率)
类别型变量 So (指示该州是否位于南方的指示变量)将作为分组变量使用
独立样本的t检验
这里假设两组数据是独立的,并且是从正态总体中抽得。
t.test(y ~ x, data)
y 是一个数值型变量
x 是一个二分变量
下面使用一个假设方差不等的双侧检验,比较了南方( group 1 )和非南
方( group 0 )各州的监禁概率:
> library(MASS)
> t.test(Prob ~ So,data=UScrime)