卡方检验是一种非参检验方法,用于两个分类变量的关联性。根本思想在于比较理论频数和实际频数的吻合度或者拟合优度。
原理
卡方检验以卡方分布作为基础,其假设为:

其基本思想为假设原假设成立,计算卡方值,卡方值度量了观察频数与期望频数之间的偏离程度。如果卡方值较大,那么说明偏离程度较大,我们有理由拒绝原假设从而接受备择假设。
卡方值计算

令Ai代表该类别情况下的实际频数,Ei表示原假设成立条件下的期望频数。
用途
- 检验某个连续变量或者离散变量是否与某种理论分布接近,即分布拟合检验;
- 检验类别变量之间是否存在相关性,即列联分析;