折线图标注显著性差异分析_数据相关性分析

相关性分析用于探究两个或多个变量间的关联,判断它们是否呈现正向或负向关系,以及关系强度。通过计算相关性系数(如Pearson、Spearman和Kendall的r值)、绘制折线图或散点图,以及评估显著性系数(P值),来确定变量间的关系。当P值小于0.05,说明存在显著性差异。相关性分析适用于不需要区分自变量和因变量的情况,常在回归分析前进行。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

9eff5df1d8caf5b838d21c088693dd3a.png

| 什么是相关性分析?

对两个变量或多个变量之间相关关系的分析,叫做相关性分析。

通常用来分析两组或多组数据的变化趋势是否一致。

比如身高和体重是否存在关系,天气冷和袜子的销量是否存在关系,客户满意度和客户投诉率是否存在关系等。

6b137328707ed9f79279147773b1922e.png

| 相关性分析的内容包括哪些?

  1. 变量之间是否存在关系?有还是无?

2. 存在什么样的关系?正向还是负向?

3. 关系的强度如何?大还是小?

| 什么情况下使用相关性分析?

  1. 只想分析两个变量之间是否存在相关关系,不需要区分自变量和因变量时可用相关性分析。

2. 通常在进行回归分析之前,都需要进行相关性分析。

0daf065b0bd802365262b786fb8c8c83.png

| 如何进行相关性分析?

1. 通过计算相关性系数判断(主要是r值)

  • r的取值范围是[-1,1]。
  • 正向和负向关系的判断:若正相关,则r>0;若负相关,则r<0。
  • 关系强度的判断:
|r|>0.95:显著性相关;
|r|≥0.8:高度相关;
0.5≤|r|<0.8:中度相关;
0.3≤|r|<0.5:低度相关;
|r|<0.3:弱相关。
  • 目前相关性系数主要有3种:Pearson、Spearman和Kendall,三种分别适用不同的场合。
Pearson系数:叫皮尔逊相关系数,也叫线性相关系数,用于进行线性相关分析,是最常用的相关系数,当数据满足正态分布时会使用该系数。
Spearman系数:当数据不满足正态分布时,使用该系数。
Kendall系数:通常用于评分数据一致性水平研究(非关系研究)。

2. 通过绘制折线图或散点图判断

相关性关系的判断可以通过绘制散点图判断(SPSS和Excel均可实现绘制)。

若数据点与趋势线基本在一条线上或在这条线的附近,说明存在相关性;
若数据点在趋势线周围呈现无规律的分布状态,则说明不存在相关性。

823fa5b5b3d31e242b77f51a877f3da9.png

3. 通过计算显著性系数判断(主要是P值)

看数据的相关性,还有一个指标也需要一起看,这个指标就是P值。

P值是用来进行显著性检验的,用来检验变量之间是否有差异以及差异是否显著。若P值>0.05代表数据之间不存在显著性差异;若P值<0.05,代表数据之间存在显著性的差异。

所有的检验都是需要提前做出假设的,而显著性检验则通常是先做一个无效假设(也就是零假设),所谓的无效假设通常是“数据之间不存在显著性差异”,然后通过P值来检验这个假设是否成立。
若P>0.05,则接受原无效假设,即“数据之间是不存在显著差异的”;若P<0.05,则拒绝原假设,表明“数据之间是存在显著差异的”。

e74ed1d5e8c5914243f77b52b8d34ad9.png

| 如何计算相关性系数和显著性系数?

  1. SPSS等统计软件计算

以SPSS为例,分析-->相关-->双变量-->选择相关系数类型,得出以下结果,下图中的相关系数即为r值,Sig即为P值。

2daafffe8abe0e07fe5b6e4371d12d48.png

2. Excel函数公式计算

r值计算公式:

CORREL(array1,array2);
PEARSON(array1, array2)。

P值计算公式:

TTEST(array1,array2,tails,type)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值