两个比例的比较:参数方法(Z-test)和非参数方法(chi-square test)

本文通过一个赌博公司的案例,对比了参数方法Z-test与非参数方法卡方检验在比较两组比例时的应用。通过具体数据和R语言实现,展示了两种方法的具体步骤及结论。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Source: http://www.r-bloggers.com/comparison-of-two-proportions-parametric-z-test-and-non-parametric-chi-squared-methods/

 

考虑以下问题的例子。赌博公司所有人想验证用户是否在欺诈。为此他想比较某个玩家的成功次数和某个雇员的成功次数,从而确定其是否欺骗。在一个月时间内,玩家进行了74次赌博并赢了30次;在相同时期内,该雇员玩了103次赌博,而赢了65次。你的客户是个骗子吗?

这样的问题可以用两种不同的方法来解决:使用参数方法和非参数方法。

*参数方法的解决方案:Z-test

如果你能做如下两个假设,你就可以使用Z-test:成功的概率接近0.5;进行赌博的次数很高(在这两个条件下,二项分布就接近与Gaussian分布)。假设这些条件成立。在R中没有函数计算Z的值,因此我们记起了数学公式,然后创建相应的函数:

$$Z=\frac{\frac{x_1}{n_1}-\frac{x_2}{n_s}}{\sqrt{\widehat{p}(1-\widehat{p})(\frac{1}{n_1}+\frac{1}{n_2})}}$$

z.prop = function(x1,x2,n1,n2){
  numerator = (x1/n1) - (x2/n2)
  p.common = (x1+x2) / (n1+n2)
  denominator = sqrt(p.common * (1-p.common) * (1/n1 + 1/n2))
  z.prop.ris = numerator / denominator
  return(z.prop.ris)
}


Z.prop函数计算Z的值,输入参数为成功数(x1和x2)和赌博的总次数(n1和n2)。我们将问题中的数据代入这个函数:

z.prop(30, 65, 74, 103)
[1] -2.969695


我们获得的z值大于查表得到的z值,这样我们论断董事所关注的玩家确实是个骗子,因为其成功的概率高于非欺骗的用户。

=====================================================

* 非参数方法的解决方案:Chi-squared test

如果现在不能对问题数据做任何的假设,那么就不能将二项分布近似为Gauss分布。我们就用chi-square test来解决这样的问题,这里会应用2X2的列联表(contingency table)。在R中有函数prop.test:

prop.test(x = c(30, 65), n = c(74, 103), correct = FALSE)

    2-sample test for equality of proportions without continuity correction

data: c(30, 65) out of c(74, 103)
X-squared = 8.8191, df = 1, p-value = 0.002981
alternative hypothesis: two.sided
95 percent confidence interval:
  -0.37125315 -0.08007196
sample estimates:
prop 1     prop 2
0.4054054  0.6310680


prop.test函数计算chi-square值,输入参数为成功值(向量x中)和总努力数(向量n中)。向量x和n也能预先申明,然后调用函数:prop.test(x,n,correct=FALSE)。

在小样本的情况(n值比较小),你必须指定correct=TRUE,从而改变chi-square基于continuity of Yates来计算:

prop.test(x = c(30, 65), n = c(74, 103), correct=TRUE)

    2-sample test for equality of proportions with continuity correction

data: c(30, 65) out of c(74, 103)
X-squared = 7.9349, df = 1, p-value = 0.004849
alternative hypothesis: two.sided
95 percent confidence interval:
  -0.38286428 -0.06846083
sample estimates:
prop 1     prop 2
0.4054054  0.6310680


在以上两种情况下,我们获得的p-value都小于0.05,于是我们拒绝相等的假设,所以该用户是个骗子。为了确认,我们比较计算的chi-square值和查表的chi-square值,在R中的计算为:

qchisq(0.950, 1)
[1] 3.841459


函数qchisq计算输入alpha和自由度后得到的chi-square值。因为之前计算的chi-square大于这里计算的查表chi-square,我们论断拒绝null hypothesis H0。

 

<think>首先,用户的问题是:“卡方检验的应用场景实现方法”。用户意图是“统计学方法的应用”,所以我需要专注于卡方检验的具体应用如何实现它。 我的任务是: 1. 调用网络搜索工具进行检索。 2. 整合检索到的内容,生成详细、清晰的回答。 3. 回答必须实用、可操作。 4. 禁止将所有引用内容集中在末尾;引用应该整合在回答中。 5. 避免使用第一人称如“我”。 6. 避免步骤词汇如“首先”、“然后”。 7. 组织答案为多个方法或步骤,每个步骤间换行。 8. 如果包含代码或公式,遵循特定格式: - 数学公式:行内用 $...$,独立用 $$...$$。 - 代码:用三个反引号包裹,指定语言。 9. 在回答后添加“相关问题”部分: - 标题:§§相关问题§§:(在同一行) - 列出至少3个相关问题,基于用户问题我的回答。 - 格式:阿拉伯数字标号。 结构回答: - 分成几个部分:应用场景实现方法- 每个部分可能有子步骤或方法,用换行分隔。 - 避免步骤词汇,所以用描述性方式组织。 关键内容: - **应用场景**:卡方检验用于分类数据的假设检验,如独立性检验、拟合优度检验等。 - **实现方法**:包括计算卡方统计量、自由度、p值等。可能涉及公式代码示例。 需要搜索: - 回忆知识:卡方检验公式是 $\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}$,其中 O 是观察频数,E 是期望频数。 - 应用场景:例如,在医学研究中检验两个分类变量是否独立;在市场营销中检验广告效果等。 - 实现方法:在软件如R、Python中实现。 搜索后整合: - 确认标准应用场景。 - 提供实现步骤,包括公式代码。 代码格式: - 如果提供Python代码,使用: ```python # code here ``` 公式格式: - 行内公式:$ \chi^2 = \sum \frac{(O - E)^2}{E} $ - 独立公式:$$ \chi^2 = \sum \frac{(O_i - E_i)^2}{E_i} $$ 组织回答: 1. 介绍卡方检验。 2. 应用场景:分点描述。 3. 实现方法:分点描述,包括公式代码。 - 每个点换行分隔。 - 避免“首先”等词。 最后,添加相关问题: - 基于卡方检验,如“卡方检验的假设是什么?”、“如何解释卡方检验结果?”等。 - 至少3个问题。 完整结构: - 回答部分。 - 换行。 - §§相关问题§§: 1. ... 2. ... 3. ... 确保回答详细、清晰。</think>### 卡方检验的应用场景实现方法 卡方检验是一种非参数统计方法,主要用于分析分类变量之间的关系。它检验观察频数与期望频数之间的差异是否显著,常用于独立性检验拟合优度检验。以下内容基于网络检索结果整合,确保实用性可操作性。 #### 应用场景 卡方检验适用于多种领域,包括社会科学、医学研究市场分析。 在医学研究中,检验疾病发病率与性别或年龄组是否独立(例如,分析吸烟习惯与肺癌发生的关联)。 在市场调研中,评估广告渠道(如电视、网络)与用户购买行为是否相关(例如,比较不同广告的转化率)。 在教育领域,检查考试通过率与教学方法的关联(如传统教学 vs. 在线课程的通过人数)。 在生物学中,用于基因型分布的拟合优度检验(例如,验证孟德尔遗传定律的观察数据是否符合预期比例)。 关键前提是数据为分类变量(名义或有序),样本独立且期望频数不低于5(否则需使用Fisher精确检验)。 #### 实现方法 卡方检验的实现包括计算卡方统计量、确定自由度p值。公式基于观察频数($O_i$)期望频数($E_i$)。 独立公式: $$\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}$$ 其中,$i$ 表示类别索引,自由度 $df = (r-1)(c-1)$($r$ 为行数,$c$ 为列数)。p值通过卡方分布表或软件计算,若 p < 0.05 则拒绝原假设(假设变量独立或分布拟合)。 在Python中,使用scipy.stats库实现。例如,进行独立性检验: ```python import numpy as np from scipy.stats import chi2_contingency # 创建观察频数矩阵(例如:2x2列联表) observed = np.array([[50, 30], [20, 40]]) # 行表示变量A类别,列表示变量B类别 # 执行卡方检验 chi2, p, dof, expected = chi2_contingency(observed) # 输出结果 print(f"卡方统计量: {chi2:.2f}") print(f"p值: {p:.4f}") print(f"自由度: {dof}") print(f"期望频数:\n{expected}") ``` 此代码计算卡方值、p值期望频数。p < 0.05 表示变量间关联显著。 在R语言中,使用chisq.test()函数: ```r # 创建观察数据 observed <- matrix(c(50, 30, 20, 40), nrow = 2, byrow = TRUE) # 执行卡方检验 result <- chisq.test(observed) # 输出结果 print(result) ``` 手动计算时,先构建列联表,计算期望频数 $E_i = \frac{\text{行} \times \text{列}}{\text{总样本数}}$,再代入公式。例如,2x2表中,$E_{11} = \frac{(50+30) \times (50+20)}{140}$。 注意事项:确保数据无缺失值;若期望频数 <5,使用Yates校正或Fisher检验;结果需结合效应量(如Cramer's V)解释强度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值