相关关系的显著性检验

  • r 的抽样分布
a、当   26000851_inYs.png为较大的正值时,r 呈现左偏分布
b、当   26000851_inYs.png为较大的负值时,r 呈现右偏分布
c、只有当   26000851_inYs.png 接近0,而样本量n很大时,才能认为r是接近正态分布的随机变量,
因此以样本r来估计总体   26000851_inYs.png时,总是假设r为正态分布,这一假设常常会带来一些严重的后果

  • r 的显著性检验
如果 r 服从正态分布,可以用正态分布来检验,但 根据上述有很大的风险,所以通常采用 t 检验,该检验可以用与小样本,也可以用于大样本

a、第一步:提出假设
    H0 :    26000851_inYs.png = 0; 
    H1:   26000851_inYs.png ≠ 0

b、第二步:计算检验的统计量
26000851_BOzU.png
c、第三步:进行决策
    1、根据显著性水平a 和自由度 df = n-2 查t分布表得出 ta/2(n-2)的临界值
    2、若 | t | > ta/2,则拒绝原假设H0,表明总体的两个变量之间存在显著的线性关系

注:
即使统计经验表明相关系数在统计上是显著的,也并不一定以为着两个变量之间的存在重要的相关性,因为在大样本情况下,几乎总是导致相关系数显著。
比如, r =0.1 在大样本情况下,也可能是的 r 通过检验,但实际上,一个变量取值的差异能由另外一个变量的取值来解释的比例只有 10%,这实际上很难说明两个变量之间有实际意义上的显著关系。

  • 案例
26000852_QzfF.png
 








转载于:https://my.oschina.net/u/1785519/blog/1488535

### 如何进行Pearson相关系数显著性检验 #### 显著性检验方法概述 Pearson相关系数用于衡量两个连续型变量之间的线性关系强度和方向。然而,在实际应用中,仅计算相关系数并不足以说明两者之间是否存在显著的关系。因此,需要对相关系数进行显著性检验,判断观察到的相关是否可能由偶然因素引起。 假设检验的过程通常是基于零假设 \(H_0\) 和备择假设 \(H_a\) 进行的。对于Pearson相关系数显著性检验,\(H_0\) 表示两变量间无显著线性关系(即 \(\rho = 0\)),而 \(H_a\) 则表示存在显著线性关系(\(\rho \neq 0\))。可以通过t分布来进行检验[^1]。 #### Python 实现示例 以下是使用Python中的`scipy.stats`模块进行Pearson相关系数及其显著性检验的一个简单例子: ```python import numpy as np from scipy.stats import pearsonr # 定义数据集 data_x = np.array([1, 2, 3, 4, 5]) data_y = np.array([2, 4, 6, 8, 10]) # 计算Pearson相关系数及p值 corr_coef, p_value = pearsonr(data_x, data_y) print(f"Pearson Correlation Coefficient: {corr_coef}") print(f"P-value: {p_value}") if p_value < 0.05: print("The correlation is statistically significant.") else: print("The correlation is not statistically significant.") ``` 此代码片段展示了如何利用 `pearsonr()` 函数同时获取相关系数和对应的p值。如果p值小于设定的显著水平(常见的是0.05),则可以拒绝原假设并认为这两个变量间的线性关系具有统计学意义[^4]。 #### R语言实现示例 在R语言中也可以很方便地完成这一过程,下面是一个简单的实例演示: ```R # 创建向量 x <- c(1, 2, 3, 4, 5) y <- c(2, 4, 6, 8, 10) # 执行相关分析测试 result <- cor.test(x, y, method="pearson") cat("Correlation coefficient:", result$estimate, "\n") cat("P value:", result$p.value, "\n") if (result$p.value < 0.05){ cat("The correlation is statistically significant.\n") } else { cat("The correlation is not statistically significant.\n") } ``` 这段脚本同样返回了Pearson相关系数以及相应的p值,并依据预设阈值评估了结果的重要性级别[^3]。 #### 结果解释 当执行上述任一程序后获得的结果显示p值低于选定的α水准时,则表明所测得的数据点集合确实表现出某种程度上的关联;反之,则意味着样本不足以证明任何有意义的趋势存在于总体之中[^5]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值