多方法做配对样本t检验(三)

Wilcoxon符号秩检验

Wilcoxon符号秩检验(Wilcoxon Signed-Rank Test) 是一种非参数统计方法,用于检验两组相关样本(配对样本)之间的差异是否显著。它通常用来代替配对样本t检验,特别是在数据不符合正态分布或者样本量较小的情况下。与配对样本t检验不同,Wilcoxon符号秩检验不依赖于数据的正态性假设,而是基于数据的秩次(rank)进行计算。

Wilcoxon符号秩检验的背景和适用情况

  • 非参数检验:Wilcoxon符号秩检验属于非参数检验方法,这意味着它不要求数据必须服从特定的分布(如正态分布)。因此,当样本数据无法满足正态性假设时,Wilcoxon检验提供了一个稳健的替代方案。

  • 应用场景:它通常用于检验相同个体或单位在两种条件下的测量值是否存在显著差异。常见的应用场景包括:

    • 治疗前后数据的比较(如药物治疗前后血压的变化)。
    • 相同受试者在不同时间点或不同条件下的测量结果。
  • 替代配对样本t检验:当数据的分布不符合正态性时,或者样本量非常小,配对样本t检验可能不适用。这时,Wilcoxon符号秩检验作为一种无分布假设的检验方法更为适用。

47a058c983dd4ead8bd2fc562e230b09.png


代码

代码解析:

wilcox.test(purchase ~ 编组, data = data1, alternative = "two.sided")

参数解释:

  • purchase ~ 编组:这是一个 公式(formula),用于指定要比较的变量和分组变量。
    • purchase 是因变量(依赖变量),表示购买数据(可能是购买的金额、次数或其他相关数据)。
    • 编组 是分组变量(自变量),表示不同的组或类别(例如,可能是“组1”和“组2”)。
  • data = data1:指定使用的数据框 data1,其中包含了 purchase编组 两列数据。
  • alternative = "two.sided":指定检验的类型为 双尾检验,即检验两个组的中位数是否存在显著差异,方向不确定(与单尾检验的假设相对)。

检验类型:

  • Wilcoxon秩和检验(又叫做 Mann-Whitney U 检验)用于比较两组独立样本的分布差异。它不要求数据服从正态分布,适用于数据不满足正态性假设的情况。
  • alternative = "two.sided" 表示这是一个 双尾检验,目的是判断两个组的中位数是否存在显著差异。检验的原假设是:“两个组的中位数相等”,备择假设是:“两个组的中位数不相等”。

输出解释:

Wilcoxon rank sum test with continuity correction

data:  purchase by 编组
W = 10228, p-value = 0.0001133
alternative hypothesis: true location shift is not equal to 0

1. 检验类型

  • Wilcoxon rank sum test with continuity correction:表示使用了 Wilcoxon秩和检验,并且应用了 连续性修正(continuity correction)。在某些情况下,Wilcoxon检验会对结果进行修正以提高准确性,特别是样本量较小或者数据呈现离散分布时。

2. W 统计量

  • W = 10228:这是 Wilcoxon秩和检验的统计量,即根据数据的秩次计算得出的统计量。该值用于评估两个组是否有显著差异。W值越大或越小,意味着两组差异越明显。

3. p值

  • p-value = 0.0001133:这是检验的 p值。它表示在零假设(两个组的中位数相等)的前提下,观察到或更极端的结果出现的概率。
    • p值小于显著性水平(如 0.05) 时,拒绝零假设,表示两组之间存在显著差异。
    • 在这个例子中,p-value = 0.0001133,远小于 0.05,因此我们可以拒绝零假设,认为两个组的中位数存在显著差异。

4. 备择假设

  • alternative hypothesis: true location shift is not equal to 0:表示 备择假设 是“两个组的中位数存在显著差异”,也就是“两个组的 位置变化 不等于 0”。
    • 由于 alternative = "two.sided",备择假设是“两个组的中位数不相等”。
    • 如果 p值小于显著性水平(如 0.05),我们会拒绝零假设,接受备择假设。

总结

  1. 检验目的:使用 Wilcoxon秩和检验,检验 purchase 变量在不同分组(由 编组 变量划分的组)之间是否存在显著差异。
  2. 结果解读
    • W = 10228 是秩和检验的统计量。
    • p-value = 0.0001133 显示出非常显著的差异(p值远小于0.05),因此我们可以拒绝零假设,即认为两个组的中位数存在显著差异。
  3. 结论:根据该检验结果,我们得出结论,purchase 变量在不同 编组 下有显著差异。

与经典的t检验的区别:

  • t检验(通常用于正态分布数据)假设数据来自正态分布,而 Wilcoxon秩和检验 是一种非参数方法,不要求数据服从正态分布,因此适用于数据分布未知或不满足正态性假设的情况。

 

### 双样本t检验配对样本t检验的区别 #### 区别 双样本t检验(独立样本t检验)用于评估来自两个不同群体的数据均值是否存在显著差异。这两个群体应相互独立,即一个群体中的观测值不应影响另一个群体中的观测值[^3]。 相比之下,配对样本t检验专门针对同一组对象在两种条件下获得的两套数据进行分析。这种情况下,每一对观察值都是关联的,比如同一个人在接受某种治疗前后的血压读数。因此,该测试能够更精确地控制个体间的变异因素[^2]。 #### 应用场景 对于双样本t检验而言,当研究者希望比较完全不相关的两个群组间某变量平均值得时候会采用此法。例如,在医学领域中对比新药和安慰剂的效果;教育界里衡量两种教学方法对学生成绩的影响等情形下都适合运用这种方法来判断两者之间是否存在统计意义上的差距[^1]。 而配对样本t检验则更多应用于实验设计中有自然匹配关系的情况或是纵向研究设置内——也就是同一个体被多次测量的情景之下。典型例子包括临床试验里的基线特征与干预措施实施之后的变化情况对照;市场调研方面关于消费者态度转变的研究等等[^4]。 ```python import scipy.stats as stats # 假设data_before 和 data_after 是配对样本的数据集 paired_t_statistic, paired_p_value = stats.ttest_rel(data_before, data_after) print(f'Paired T-test statistic: {paired_t_statistic}, P-value: {paired_p_value}') ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

爱做科研的桶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值