SPSS主成分分析

主成分分析能够解决多个指标之间存在的信息不统一或冗余等问题,是一种降维的统计方法。
【主成分分析与因子分析】
相同:两者都是降维和信息浓缩的方法。生成的新变量可代表原始的大部分变量,且相互独立。
区别:主成分分析强调新变量贡献了多大比例的方差,不关心新变量是否有明确的实际意义;因子分析要求新变量具有实际意义,能解释原始变量的内在结构。
以归一化后的11个时间段的t1~t31个变量为例:

【分析-降维-因子分析】
1.“描述”中勾选“系数”和“KMO和Bartlett球形度检验”:
“系数”:输出变量之间的相关系数矩阵,可以直观的分析相关性。
“KMO和Bartlett球形度检验”:用于定量检验变量之间是否具有相关性。
KMO值:一般大于0.7就说明变量之间有相关性;
Bartlett球形度检验:p值<0.001,有相关性。
【PS:如果数据量小于变量数,“KMO和Bartlett球形度检验”将不会出现结果】

2.“抽取”中勾选“碎石图”:可以直观了解输出结果。

3.此时可点击“确认”,查看第一个主成分分析结果:

“总计”:为成分对应的特征值,表示所解释的方差的大小;
“方差百分比”:对应成分所包含的方差占总方差的百分比;
一般来说,SPSS默认选择特征值大于1的成分作为主成分。
根据表,可选1,2和3作为主成分。
4.分析成分矩阵

经分析,该成分矩阵不能很好的解释实际变量代表的含义,所以通过因子旋转获得更好的解释。【此步视具体情况而定】
5.“旋转”中点击“最大方差法”,勾选“载荷图”

6.“得分”中勾选“保存为变量”,“显示因子得分系数矩阵”

7.得到因子旋转后的结果


经过旋转,3个成分有了合理的解释。

点击“保存为变量”后,SPSS会自动生成每个主成分的结果:

该结果由以下公式可得:(可自行验证)
FAC1=T1* 0.031+T2* 0.023+……+* T3
FAC2,FAC3同理可得。
其中,系数由“成分得分系数矩阵”可得,T1,T2,……为【原始变量标准正态变换后的变量】,【不是原始变量!】
8.主成分得分和综合得分
主成分n的得分=(特征值的算术平方根)*FACn
综合得分F= (主成分1对应的方差百分比)/(总方差百分比)*FAC1+(主成分2对应的方差百分比)/(总方差百分比)*FAC2+(主成分3对应的方差百分比)/(总方差百分比)*FAC3
即:F=(46.095/95.868)*FAC1+(43.374/95.868)*FAC2+(6.399/95.868)*FAC3

### 主成分分析原理 主成分分析(Principal Component Analysis,PCA)是一种无监督的线性变换技术,旨在将一组可能存在相关性的变量转换为一组线性不相关的变量,这些新的变量被称为主成分。其核心思想是通过正交变换,将原来的数据投影到一个新的坐标系中,使得数据在新坐标系下的方差最大化。第一个主成分具有最大的方差,后续的主成分依次具有递减的方差,且与前面的主成分相互正交(即不相关)。这样可以在尽量保留原始数据信息的前提下,减少数据的维度,简化数据结构,便于后续的分析和处理。 ### Spss进行主成分分析的操作方法 1. **数据准备**:将需要分析的数据录入到Spss软件中,确保数据的格式正确,每一列代表一个变量,每一行代表一个观测值。 2. **选择分析菜单**:依次点击“分析” - “降维” - “因子分析”。 3. **变量选择**:将需要进行主成分分析的变量选入“变量”框中。 4. **设置分析选项**: - 在“描述”选项卡中,可以选择输出相关矩阵、初始解等信息。 - 在“抽取”选项卡中,方法选择“主成分”,可以根据需要选择基于特征值大于某个值(通常为1)或者指定主成分的数量来确定提取的主成分个数。 - 在“旋转”选项卡中,若需要对主成分进行旋转以使其更易于解释,可以选择合适的旋转方法,如“方差最大法”等。 - 在“得分”选项卡中,可以选择计算主成分得分并保存到数据文件中。 5. **运行分析**:点击“确定”按钮,Spss将执行主成分分析并输出结果。 ### 案例分析 假设有一个关于学生综合素质评价的数据,包含学生的语文成绩、数学成绩、英语成绩、物理成绩、化学成绩和生物成绩等多个变量。通过主成分分析可以找出少数几个综合指标(主成分)来概括学生的综合素质。 在Spss中按照上述操作方法进行分析后,得到以下结果: - **相关矩阵**:可以查看各个变量之间的相关性,了解变量之间的关系强度。 - **公因子方差**:反映了每个变量被主成分所解释的方差比例,值越接近1说明该变量被主成分解释的越好。 - **总方差解释**:列出了每个主成分的特征值、方差贡献率和累积方差贡献率。一般选择累积方差贡献率达到一定比例(如80%以上)的主成分作为最终的分析结果。 - **成分矩阵**:显示了每个变量在各个主成分上的载荷,载荷的绝对值越大,说明该变量与主成分的相关性越强。通过分析载荷可以解释每个主成分的含义,例如某个主成分在语文、英语等文科成绩上的载荷较大,可能代表学生的文科综合能力。 - **主成分得分**:可以将计算得到的主成分得分保存到数据文件中,用于后续的进一步分析,如聚类分析、回归分析等。 ### 代码示例(虽然Spss主要通过菜单操作,但可以通过语法命令实现相同功能) ```plaintext FACTOR /VARIABLES 语文成绩 数学成绩 英语成绩 物理成绩 化学成绩 生物成绩 /MISSING LISTWISE /ANALYSIS 语文成绩 数学成绩 英语成绩 物理成绩 化学成绩 生物成绩 /PRINT INITIAL CORRELATION KMO EXTRACTION ROTATION /CRITERIA FACTORS(3) ITERATE(25) /EXTRACTION PC /ROTATION VARIMAX /SAVE REG(ALL) /METHOD=CORRELATION. ```
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Prophet.Z

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值