前言
自学笔记,分享给对统计学原理不太清楚但需要在论文中用到的小伙伴,欢迎大佬们补充或绕道。ps:本文不涉及公式讲解(文科生小白友好体质)~(部分定义等来源于知乎)
本文重点:皮尔逊相关分析
【1.皮尔逊相关分析的简单原理】
【2.皮尔逊相关分析的数据实例】
【3.皮尔逊相关分析代码】
▷重要:相关关系不等于因果关系
1.皮尔逊相关分析的简单原理(简单看看就行)
- 假设检验:皮尔逊相关检验的零假设(H0)是两个变量之间没有线性关系,即相关系数等于0;备择假设(H1)是两个变量之间存在线性关系,即相关系数不等于0。
- 计算相关系数(皮尔逊相关系数(r)的计算公式):
r = (Σ((X - μX)(Y - μY))) / (n * σX * σY)
其中,X和Y是两个变量,μX和μY分别是X和Y的均值,σX和σY分别是X和Y的标准差,n是样本量。
- 计算 p 值:根据样本量和相关系数,可以计算出 p 值,用于判断相关性的显著性水平。通常,如果 p 值小于显著性水平(如0.05),则拒绝零假设,认为两个变量之间存在显著的线性关系。

本文介绍了皮尔逊相关分析的基本原理,包括其计算方法、注意事项,以及如何通过实例和Python代码来检验变量间的关系。强调了相关性与因果关系的区别,并提供了实际数据中的应用示例。
最低0.47元/天 解锁文章
3932





