皮尔逊相关系数
要先确定有线性关系,才能反应相关的大小
首先要画散点图目的是为了看是否具有线性关系
选择矩阵散点图
然后把所有的变量移进去
既可得到任意两个变量之间的线性关系
通过散点图来简略判断是否具有线性关系
为什么要首先看是否具有相关性呢?
上面四个图的皮尔逊相关系数都是0.816,但是显然只有图一具有线性关系,所以只有先确定有线性关系,才能用皮尔逊相关系数
描述性统计
求最小值,最大值,中位数,众数,偏度,峰度,标准差,方差等等
用spss做数据分析
jb检验(样本数>30)
正态分布检验
% 正态检验的偏度和峰度
x = normrnd(2,3,1000,1)
skewness(x)%偏度
kurtosis(x)%峰度
% 检验第一列数据是否为正态分布
[h,p] = jbtest(x,0.05)
Shapiro-wilk检验(小样本)
用spss
QQ图可以近视估算是不是正态分布
斯皮尔曼spearman相关系数
斯皮尔曼相关系数和皮尔逊相关系数的选择
1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用
spearman相关系数也可以,就是效率没有pearson相关系数高。
2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。
3.两个定序数据之间也用spearman相关系数,不能用pearson相关系数。
一般情况下都能使用斯皮尔曼相关系数
求解斯皮尔曼相关系数的代码
RX = [3 8 4 7 2]'
RY = [5 10 9 10 6]'
R = corr(