列联表和定性变量之间相关性的研究:Pearson的chi-squred test

Source: http://www.r-bloggers.com/contingency-table-and-the-study-of-the-correlation-between-qualitative-variables-pearsons-chi-squared-test/

 

如果你有定性的变量(qualitative variable),可通过研究列联表(contingency table)R by C,并使用Pearson的chi-squared检验来验证相关性。

---------------------------------------------

一个赌场想要研究赌博玩法模式和不同年龄群组中赢家数目之间的相关性,想看看赢家的数目是否依赖于赌博游戏的类型,从经验来看。这里有如下数据:

Age vs Game
 Age  
Game20-3031-4041-50
Roulette445655
Black-jack668823
Poker152945

在R中,你必须首先用收集的数据构建一个矩阵:

table <- matrix(c(44,56,55, 66,88,23, 15,29,45), nrow=3, byrow=TRUE)


现在我们能够计算chi-squared相关系数了:

chisq.test(table)

        Pearson's Chi-squared test

data:  table 
X-squared = 46.0767, df = 4, p-value = 2.374e-09


因为p-value < 0.05,于是我们拒绝null hypothesis H0,即拒绝相关系数为0:在玩家年龄和其赢的可能性之间有很强的相关性。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值