应用统计学第13周作业(主成分分析)

该博客探讨了通过降维方法(如主成分分析PCA)保留83.64%信息的情况,其中人均可支配收入成为关键变量。成分1代表房地产市场条件,成分2则主要由人均可支配收入驱动。进一步分析表明,降维到1维可能更合适,因所有变量与成分1关系密切。在2维聚类后,数据仍显示较强线性相关性,最终选择1维表示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述

1.
(1).

在这里插入图片描述
通过总方差解释表,可以看出如果将原数据空间降为2维,保留的信息精度是83.64%。

(2).

在这里插入图片描述
在这里插入图片描述

人均可支配收入和人均使用面积是两个个人因素,其他的可以算作是市场总体因素,从成分矩阵和组件图可以看出,人均可支配收入和成分2的相关系数达到0.9,而其他因素和成分2相关系数很小,所以成分2可以用人均可支配收入代替。

成分1可以看做是房地产市场条件。

(3).

在这里插入图片描述
在这里插入图片描述
北京和上海的人均可支配收入相当高,遥遥领先;但房地产市场水平比较低,但东莞的这项数据非常高,观察数据可以发现东莞的人均使用面积远超其他城市。

2.

在这里插入图片描述

通过总方差解释表,可以看出如果将原数据空间降为2维,保留的信息精度是81.42%。

在这里插入图片描述
在这里插入图片描述
所有变量都和成分1关系比较大而和成分2关系不大,可以考虑降成1维。

在这里插入图片描述
在这里插入图片描述
在2维情况下聚类之后画散点图效果比较一般,因为二维数据还是显示出比较强的线性相关性,最后还是化成1维。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cachel wood

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值