数据相关性分析

皮尔逊相关系数

要先确定有线性关系,才能反应相关的大小

首先要画散点图目的是为了看是否具有线性关系

image-20230712151129841

选择矩阵散点图

image-20230712151155521

然后把所有的变量移进去

image-20230712151223651

既可得到任意两个变量之间的线性关系

image-20230712151245922

通过散点图来简略判断是否具有线性关系

为什么要首先看是否具有相关性呢?

image-20230712151504384

上面四个图的皮尔逊相关系数都是0.816,但是显然只有图一具有线性关系,所以只有先确定有线性关系,才能用皮尔逊相关系数

描述性统计

求最小值,最大值,中位数,众数,偏度,峰度,标准差,方差等等

用spss做数据分析

image-20230712151715304

jb检验(样本数>30)

正态分布检验
% 正态检验的偏度和峰度
x = normrnd(2,3,1000,1)
skewness(x)%偏度
kurtosis(x)%峰度

% 检验第一列数据是否为正态分布
[h,p] = jbtest(x,0.05)


Shapiro-wilk检验(小样本)

用spss

QQ图可以近视估算是不是正态分布

斯皮尔曼spearman相关系数

斯皮尔曼相关系数和皮尔逊相关系数的选择

1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用

spearman相关系数也可以,就是效率没有pearson相关系数高。

2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。

3.两个定序数据之间也用spearman相关系数,不能用pearson相关系数。

一般情况下都能使用斯皮尔曼相关系数

求解斯皮尔曼相关系数的代码

RX = [3 8 4 7 2]'
RY = [5 10 9 10 6]'
R = corr(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天热写代码不吹空调

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值