毕业论文知识点记录(三)——SPSS去相关
#(一)数据下载
1、草地贪夜蛾的发生记录,这个数据在前面文章中有描述。草地贪夜蛾发生记录下载
2、气候数据
数据来源:worldclim
我选择的分辨率是30″的。
最后可以得到十九个tiff格式的环境数据。
#(二)数据处理
主要讲述对于worldclim的数据怎么处理。
1、去相关
说到去相关,我使用皮尔逊相关系数进行处理,但是现在缺少的是excel的数据,这样才可以导入到SPSS中进行分析,所以首先需要在arcgis中进行“值提取到点”的操作。
(1)值提取到点
但是因为有19个数据,所以最理想的还是批量处理,所以我在网上找到了博主的脚本,可以进行批量“值提取到点”的处理:批量处理
这时候就可以看到发生记录点的图层的属性值已经提取到属性表里了。
不过这个时候就要想怎么批量导出到excel中呢?
同样也是使用代码,有的博主已经写好了代码,可以直接使用。我是导出txt文本之后,用py直接循环转换为csv文件,最后进行汇总。
(2)相关性分析
导入SPSS软件,选择,分析->相关->双变量即可有结果
但是导入的时候我也遇到了一些问题。
导入的时候发现只有前三列数据,一开始以为SPSS只能处理前几列,但后来发现是因为后面环境数据导入的时候因为有空格,所以被识别为文本字符串,不可以作为相关分析的候选变量,如果直接在变量视图里改变数据类型的话,一些原有数据不被识别,所以此方法不可行。
继续百度
感谢山水阿锐!!!
可以看到类型导入的时候已经变成数字类型了
接下来继续软件操作。
选择平均值和标准差
但是但是但是
butbutbutbut
最后结果还是有点离谱,很多看起来不相关的变量,最后计算结果都是0.99多,非常离谱。
本来想画一下它们之间的散点图看看直观的关系,结果一画画出了问题,有异常值!
有些值是-9999,所以就筛掉这些数据就好啦(用excel删除重复项)。
这样的数据就很好了嘛。