python相关性分析_Python:相关性分析

本文探讨了Python中的相关性分析,通过一个数据集展示了学习时间和分数之间的相关性。通过散点图和相关系数矩阵,得出学习时间和分数高度正相关的结论,相关系数为0.92,意味着学习时间越长,分数通常会越高。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、相关关系:相关分析与回归分析在实际应用中有密切关系。然而在回归分析中,所关心的是一个随机变量Y对另一个(或一组)随机变量X的依赖关系的函数形式。而在相关分析中 ,所讨论的变量的地位一样,分析侧重于随机变量之间的种种相关特征。例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。

确定相关关系的存在,相关关系呈现的形态和方向,相关关系的密切程度。其主要方法是绘制相关图表和计算相关系数。

二、代码案例

创建一个具有相关关系的数据集:

from collections import OrderedDict

import pandas as pd

#数据集

examDict = {

'学习时间':[0.50,0.75,1.00,1.25,1.50,1.75,1.75,2.00,2.25,

2.50,2.75,3.00,3.25,3.50,4.00,4.25,4.50,4.75,5.00,5.50],

'分数':[10,22,13,43,20,22,33,50,62,48,55,75,62,73,81,76,64,82,90,93]

}

examOrderDict = OrderedDict(examDict)

examDf = pd.DataFrame(examOrderDict)

#查看前五行

examDf.head()

画出散点图,直观分析学习时间与分数之间的相关性

exam_X = examDf.loc[:,'学习时间']

exam_Y = examDf.loc[:,'分数']

# 绘制散点图</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值