统计学——协方差和相关系数

文章介绍了如何通过矩阵面积来直观理解变量之间的正负相关性,然后引出协方差的概念,作为衡量变量线性相关性的指标。接着,讨论了Pearson相关系数,它消除了单位影响,便于比较不同单位变量的相关性。此外,还提到了Spearman秩相关系数和Kendall相关系数,它们适用于非正态分布的数据,尤其是Spearman秩相关系数和Kendall相关系数在处理有序数据时更为适用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.矩形面积

引入两个常见变量身高X和体重Y,这两者是比较常见的正相关,以下是一组身高和体重数据:
在这里插入图片描述
我们在平面坐标上先画出2个人的坐标点,然后以两个点画一个矩阵,为了后续更好的解释正负相关性,我们用红色表示正相关,蓝色表示负相关。那么前两个点之间就是红色矩阵。计算矩阵面积为(160-152)×(54-45)=72,结果是正数。
在这里插入图片描述
接下来我们在该平面上引入第三个点,那么第三个点和前两个点分别组成矩阵,由于该同学比较瘦高,那么第三个点和前两个点呈负相关,呈蓝色,如下图所示。计算其中一个蓝色矩阵面积(172-152)×(44-45)=-20,面积为负数。
在这里插入图片描述
以此类推,我们将所有点都引入到该平面,并画出所有矩阵,如下图所示
在这里插入图片描述
从以上平面中我们可以看到,平面中红色矩阵占大部分,而蓝色矩阵比较少,所以整体呈现红色。我们计算所有矩阵的面积,最后的结果也为正数,这说明X,Y这两个随机变量整体上是正相关的关系;如果蓝色矩阵占大多数,所有矩阵的面积为负数,则两个变量是负相关;如果两个颜色差不多,矩阵面积为0,则不相关。
我们用数学公式表示所有的矩阵面积如下:
A=∑i,j=12...ni≤j(xi−xj)(yi−yj)A = \sum_{i,j=12...n}^{i≤j}(x_i-x_j)(y_i-y_j)A=i,j=12...nij(xixj)(yiyj)
那么X和Y的相关性={ 正相关,A>0负相关,A<0不相关,A=0X和Y的相关性 = \left\{\begin{aligned}正相关,A>0\\ 负相关,A<0\\ 不相关,A=0 \end{aligned}\right.XY的相关性= 正相关,A>0负相关,A<0不相关,A=0

2.协方差

我们需要对上门的矩阵面积公式进行简化,我们用X的均值μXμXμX替换所有XjX_jXj,用Y的均值μYμYμY替换所有YjY_jYj

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIGC人工智残

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值