1 前提假设
使用Pearson相关分析时,需要考虑满足5个假设。
1. 两个变量都是连续变量。
2. 两个连续变量应当是配对的,即来源于同一个个体。
3. 两个连续变量之间存在线性关系,通常做散点图检验该假设。
4. 两个变量均没有明显的异常值。Pearson相关系数易受异常值影响。
5. 两个变量符合双变量正态分布。
2 验证前提假设
2.1 两个连续变量之间存在线性关系
Pearson要求两个变量之间存在线性关系。要确定是否存在线性关系,需要查看两个变量的散点图。如果散点图大致呈一条直线,说明有线性关系。但是,如果不是一条直线(如一条曲线)则没有线性关系。下图给出了线性和非线性关系的例子。

计算Pearson相关系数时,应有类似于上述第一个散点图的线性关系。如果两变量间不存在线性关系,应考虑其他基于非线性关系的统计方法。
2.2 没有明显的异常值
异常值可能会对相关分析的结果造成很大影响。检验线性假设的散点图中,异常值的点很容易被识别出来。

如果异常值存在,应修改为正确值或进行变换去除,并

本文介绍了使用Pearson相关分析需满足的5个前提假设,包括变量为连续、配对、有线性关系、无明显异常值、符合双变量正态分布。还阐述了验证这些假设的方法,如查看散点图、检验正态分布等,最后提及了Pearson相关系数的计算及研究问题时的假设。
最低0.47元/天 解锁文章
1330

被折叠的 条评论
为什么被折叠?



