卡方检验案例
卡方检验可以用于检验两个变量之间是否有关系,也就是常说的四格表。
例如:探究性别对购买某商品的影响,数据见下表
男 | 女 | 总计 | |
---|---|---|---|
买 | 240 | 60 | 300 |
不买 | 150 | 70 | 220 |
总计 | 390 | 130 | 520 |
从上表可以算出,购买商品的人占总人数:300520×100%=57.7%\frac{300}{520}\times100\%=57.7\%520300×100%=57.7% 不购买商品的人占总人数 42.3%42.3\%42.3%;所以理论上购买商品的人数如下表:
男 | 女 | 总计 | |
---|---|---|---|
买 | 390×57.7%=225390\times57.7\%=225390×57.7%=225 | 75 | 300 |
不买 | 165 | 55 | 220 |
总计 | 390 | 130 | 520 |
计算自由度:n=(2−1)×(2−1)=1n=(2-1)\times(2-1)=1n=(2−1)×(2−1)=1 实际上确定表格中四个值的一个就能得出全部,所以能自由选择的数是1,即自由度是1。
计算卡方值:X2(1)=(240−225)2225+(150−165)2165+(60−75)275+(70−55)255=9.4545\mathcal{X}^2(1)=\frac{(240-225)^2}{225}+\frac{(150-165)^2}{165}+\frac{(60-75)^2}{75}+\frac{(70-55)^2}{55}=9.4545X2(1)=225(240−225)2+165(150−165)2+75(60−75)2+55(70−55)2=9.4545
假设置信度为 p=95%p=95\%p=95% ,即 P(X2(1)≤Xp2(1))=95%=0.95P(\mathcal{X}^2(1)\leq\mathcal{X}_p^2(1))=95\%=0.95P(X2(1)≤Xp2(1))=95%=0.95 查表发现 Xp2(1)=3.8415\mathcal{X}_p^2(1)=3.8415Xp2(1)=3.8415 因为原假设为与性别没关系,此时X2(1)=9.4545>3.8415=Xp2(1)\mathcal{X}^2(1)=9.4545>3.8415=\mathcal{X}^2_p(1)X2(1)=9.4545>3.8415=Xp2(1)故购买某商品与性别有关系。