Pearson 相关分析 理论与应用

本文介绍了使用Pearson相关分析需满足的5个前提假设,包括变量为连续、配对、有线性关系、无明显异常值、符合双变量正态分布。还阐述了验证这些假设的方法,如查看散点图、检验正态分布等,最后提及了Pearson相关系数的计算及研究问题时的假设。

1 前提假设

使用Pearson相关分析时,需要考虑满足5个假设。

1. 两个变量都是连续变量。

2. 两个连续变量应当是配对的,即来源于同一个个体。

3. 两个连续变量之间存在线性关系,通常做散点图检验该假设。

4. 两个变量均没有明显的异常值。Pearson相关系数易受异常值影响。

5. 两个变量符合双变量正态分布。

2 验证前提假设

2.1 两个连续变量之间存在线性关系

Pearson要求两个变量之间存在线性关系。要确定是否存在线性关系,需要查看两个变量的散点图。如果散点图大致呈一条直线,说明有线性关系。但是,如果不是一条直线(如一条曲线)则没有线性关系。下图给出了线性和非线性关系的例子。

 计算Pearson相关系数时,应有类似于上述第一个散点图的线性关系。如果两变量间不存在线性关系,应考虑其他基于非线性关系的统计方法。

2.2 没有明显的异常值

异常值可能会对相关分析的结果造成很大影响。检验线性假设的散点图中,异常值的点很容易被识别出来。

如果异常值存在,应修改为正确值或进行变换去除,并

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值