实验一地区社会弱势性空间格局分析
- 实验概述
- 背景及目的
- 本实验涉及的软件
- 数据说明
- 整体实验设计
- 实验步骤
- 探索性数据分析
- 综合指标构建
- 数据标准化
- 主成分分析
- KMO和Bartlett球形度检验
- 方差解释报表
- 旋转成分矩阵
- 成分得分系数矩阵
- 空间格局分析
实验概述
背景及目的
社会弱势性是指个人、家庭或群体因资源缺乏,难以获取充足的食物、良好的住房条件平等的教育机会、充分的就业机会、适量的社会服务或消费型娱乐活动,从而影响其拥有正常水平的日常生活、消费和娱乐的不平等社会现象。综合中部五省(河南、安徽、湖北、湖南江西)各地市收入、教育、住房、人口结构等多方面因素,本实验利用主成分分析构建社会弱势性综合评价指数,结合空间自相关分析和聚类分析,研究社会弱势性空间分布格局及分布模式,借助空间回归模型探究社会弱势性与城市化水平间的关系。通过本实验希望达到以下目的:①理解多维度指标集成的原理和方法;②了解不同类型的空间权重矩阵对空间自相关分析的影响;③掌握并运用空间回归模型研究实际问题。
本实验涉及的软件
ESRI ArcGIS
SPSS
Excel
Geoda
数据说明
本实验所使用的数据存储于 data_exp1文件夹中,包含的数据内容及其来源见表 1.1。

在实际研究中,存在数据收集和预处理的阶段。该阶段涉及的操作包括社会经济数据的收集和清洗、空间数据与社会经济数据的对应、投影系统的选定等,这些操作已经预先完成,并形成了本实验提供的原始数据,读者可以直接使用这些数据进行空间统计分析。
整体实验设计
为了整体把握和描述 2010年中部五省社会弱势性的统计特点,可以使用描述性统计的方法,从统计学的角度分析相应社会经济指标表现出的特征。同时,为了研究中部五省社会弱势性的整体空间格局,需要构建一个横向可比的综合指数。由于原始数据中社会经济指标众多,日指标之间具有一定的相关性,可以选用主成分分析的方法进行因子降维和指标聚合。通过对综合指数及各维度上的指数进行空间可视化,可以分析中部五省各地市社会弱势性的空间格局。为了探究弱势群体在空间上是呈现聚集、离散还是随机分布的模式,通常可以采用全局空间自相关指数 Moran’sI和局部空间自相关指数 LISA 进行探索性空间分析。值得注意的是,不同的空间权重矩阵可能对自相关指数的结果产生影响,本实验也将一并探讨这些情况。另外,结合聚类方法及空间可视化技术研究多维度空间分布特征,对于辨别探究区域中不同研究单元的社会弱势性特征具有重要意义。
对于实验所构建的社会弱势性综合评价指数,可以进一步探究其在城市研究中的应用。本实验探讨的是该指数在城市发展公平性评价中的应用。
本实验的整体流程如图1.1所示。

实验步骤
探索性数据分析
本次实验采集的社会经济指标主要包括收入、教育、住房和人口结构等多个方面。进行描述性统计的主要步骤如下。
打开 SPSS软件,选取原始数据文件存放路径,调整打开的文件类型为Excel文件。打开原始数据表格


在弹出的对话框中,选择从第一行读取变量名,点击“确定”按钮。

可以发现,在 SPSS 生成的数据中有两个文件,其中sav格式的是数据文件spv格式的是输出统计报表的结果文件。实际应用中,这两个文件都可以保存。


点击分析一描述统计→描述,根据下图红框的指标来选取需要参与统计的指标,



得到统计结果

综合指标构建
数据标准化
首先需要对分析指标进行极差标准化。


有需要的同学请移步到ArcGIS新手之数据标准化
https://blog.youkuaiyun.com/qq_51795219/article/details/147354002?spm=1011.2124.3001.6209
主成分分析
使用 SPSS 软件进行主成分分析,下面给出操作流程。
首先将标准化之后的指标载入SPSS分析环境,然后使用分析一降维一因子分析,打开主成分分析面板。选取参与分析的指标,并在面板中勾选需要的设置。设置完成后,点击“确定”运行主成分分析模型。输出的报表将导出在后缀为.spv的文件中。对于主成分分析输出的结果,需要关注如下几个关键指标或报表。









KMO和Bartlett球形度检验
本实验KMO值为0.736,且通过Bartlett 球形度检验。这表明变量间有一定的相关关系,适用于使用主成分分析进行指标聚合。

方差解释报表
从图中可以发现特征值大于1的共有四个成分,累积解释了原始指标82.208%的信息,故上述指标可以由四个主成分来表达原始指标所反映的信息。

旋转成分矩阵
采用旋转成分矩阵能够更好地归纳出因子,一般而言,提取旋转成分矩阵中载荷大于0.7的指标作为对应主成分指标的构成指标,并根据指标构成对指标反映的维度进行概括。至此将SPSS的旋转后的成分矩阵复制到excel表中,并名为旋转成分矩阵的指标。从表中可以发现,第一主成分由白领比例、中专及以下学历、大专及以上学历比例三个指标组成,反映的是收入和教育方面的信息,可以视作社会经济地位弱势性指数;第二主成分主要由65岁以上人口比例和家庭至少有一名65岁以上老人比例两个指标构成,可以视作人口结构弱势性指数:第三主成分由文盲率和平均受教育年限两个指标构成,可以视作受教育程度弱势性指数:第四主成分由住房无厨房和住房无厕所比例两个指标构成,可以视作居住条件弱势性指数。


成分得分系数矩阵


成分依次是社会经济地位1、人口结构2、受教育程度3、住房条件4

接下来复制成分得分系数矩阵到excel表中,并以此命名,为了更好的表明计算,在表格中做了标记
如图所示

为了使得数据之间不彼此交叉混乱,本次实验便重新建立了一个名为综合指数的表格,根据标准化的表格复制对应的城市以及他们的PAC,手动添加四个主成分和一个综合指数,以此进行相对应的计算,以合肥市为例,公式如下:
C1=‘标准化结果(数值)’!D2成分得分系数矩阵!B$5+‘标准化结果(数值)’!F2成分得分系数矩阵!B$7+‘标准化结果(数值)’!G2成分得分系数矩阵!B$8
C2=‘标准化结果(数值)’!P2成分得分系数矩阵!C$15+‘标准化结果(数值)’!R2成分得分系数矩阵!C$16
C3=‘标准化结果(数值)’!E2成分得分系数矩阵!D$6+‘标准化结果(数值)’!H2成分得分系数矩阵!D$9
C4=‘标准化结果(数值)’!K2成分得分系数矩阵!E$10+‘标准化结果(数值)’!N2成分得分系数矩阵!E$13

最后结合上文在SPSS得出的解释总方差,来获取到各个主成分所对应的特征值,文中为了突出特意用黄色表明如图所示
最终公式计算得出综合指数,还是合肥市进行距离说明:CI=C2R$4+D2R$5+E2R$6+F2*R$7

空间格局分析
将得到的综合指数利用属性表连接的方法连接到原始的.shp文件上,并绘制出相应的地图。打开ArcMap10.2,通过“添加数据”按钮,添加中部五省地级市的.shp数据到内容列表。将上一步得到的主成分得分的.csv文件也添加进来,通过连接面板连接到空间数据的属性表中。





对各维度的主成分指标和社会弱势性综合指标进行空间可视化,分级标准可以选择分位数分级法。得到多指数空间分布图如图所示。


下图为C1

同上述,我们分别得出C2,C3,C4,CI的图
下图为C2

下图为C3

下图为C4

下图为CI

在数据标准化过程中,正向指标定义为指标值越大则该项指标越弱势,因此综合评价指数的得分越高表明整体越弱势。从图中可以发现,社会经济地位较为弱势的区域集中在河南、湖北、安徽三省交界的大别山区域和湖南西部,人口结构弱势的区域集中在湖南省西北部受教育程度弱势区域集中在安徽省大部分地市,居住条件较为弱势的区域集中在湖南省的中南部。综合来看,湖南省西部及安徽省与其他省交界的地市较为弱势。从图中可以发现弱势性是呈现连片分布的,这表明弱势性可能具有一定的空间依赖。
未完待续
2718

被折叠的 条评论
为什么被折叠?



