R语言中的卡方检验及假设检验误差分析
1. 卡方检验基础
卡方检验是一种常用的统计方法,用于检验数据是否符合特定的分布或两个分类变量之间是否存在关联。
1.1 给定概率的卡方检验
例如,执行如下代码进行给定概率的卡方检验:
chisq.test(x=hairy.tab,p=c(0.25,0.5,0.25))
输出结果如下:
Chi-squared test for given probabilities
data: hairy.tab
X-squared = 0.5094, df = 2, p-value = 0.7751
由于p值非常高,没有证据拒绝原假设 $H_0$。也就是说,没有证据表明 $H_0$ 中假设的比例是错误的。
1.2 两个分类变量的卡方检验
卡方检验也适用于处理两个相互排斥且完备的分类变量的情况,例如变量A和变量B。这种检验用于检测A和B之间是否存在某种影响关系(即依赖关系)。
- 原假设 $H_0$ :变量A和B是独立的(即A和B之间没有关系)。
- 备择假设 $H_A$ :变量A和B不是独立的(即A和B之间存在关系)。
为了进行检验,需要将观察数据与假设分布完全无关时的期望计数进行比较。如果与期望频率的总体偏差较大,p值就会较小,从而提供拒绝原假设的证据。
超级会员免费看
订阅专栏 解锁全文
4563

被折叠的 条评论
为什么被折叠?



