一、相关关系和相关系数
世上除了因果关系,还有相关关系。
有一个叫“相关系数”的指标来量化两个事物之间的相关程度。
其中相关系数用“r”表示,取值范围介于-1和1之间。
当(X,Y)正相关的时候,r=1;当(X,Y)负相关的时候,r=-1;当(X,Y)不相关的时候,r=0。
当然一般的线性相关有更严格的划分:
- r|<0.3 不存在线性关系
- 0.3<|r|<0.5 低度线性关系
- 0.5<|r|<0.8 显著线性关系
- |r|>0.8 高度线性关系
二、相关性和假设检验
有指标来衡量两者之间的相关程度,不代表能够去衡量相关程度。
因引入两个概念:
现在,针对我们分析的两组数据(X,Y)(两组数据被称为抽样),我们的疑问来了:
抽样的(X,Y)是否可以正确反应总体的情况呢?
这里涉及:假设检验。
具体操作如下:
零假设H0:总体的数据不

本文介绍了相关性分析的基本概念,相关系数的定义及其取值范围,并探讨了如何利用Python进行相关性分析。通过计算得到的相关系数r=0.021和p值=0.004,得出总体数据存在相关性但非线性的结论。此外,还提及了在多维数据中进行两两相关性计算的方法。
最低0.47元/天 解锁文章
8129

被折叠的 条评论
为什么被折叠?



