8、聚类分析与主成分分析的数据处理之旅

最新推荐文章于 2025-10-26 12:14:53 发布

云朵来信

最新推荐文章于 2025-10-26 12:14:53 发布

阅读量23

点赞数

CC 4.0 BY-SA版权

分类专栏：掌握R语言预测分析精髓文章标签：聚类分析主成分分析 hclust

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/b0c1d2/article/details/151467276

掌握R语言预测分析精髓专栏收录该内容

20 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

聚类分析与主成分分析的数据处理之旅

在数据处理与分析的领域中，聚类分析和主成分分析是非常重要的技术手段。下面我们将深入探讨使用 hclust() 进行凝聚式聚类以及主成分分析的具体内容。

凝聚式聚类（Agglomerative Clustering）

凝聚式聚类是一种自下而上的聚类方法，它从每个数据点作为一个单独的簇开始，然后逐步合并相似的簇，直到达到某个停止条件。我们将使用 hclust() 函数来实现凝聚式聚类，并通过两个数据集（数值数据和二进制数据）进行探索。

瑞士投票结果分析

我们使用的第一个数据集是 2001 年瑞士联邦投票对象主题的接受百分比数据。该数据集的行代表州（cantons），列（除第一列）代表投票主题，值为投票主题的接受百分比。

以下是加载数据的代码：

swiss_votes = read.table("swiss_votes.dat", sep = "\t", header = T)

我们的目标是探究 2001 年各州人口在投票行为上是否存在聚类。我们将使用三种方法（完全链接、单链接和平均链接）进行重复分析，并检查潜在的差异。

具体步骤如下：
1. 计算距离矩阵：

dist_matrix = dist(swiss_votes[2:11])

使用默认方法（完全链接）进行聚类：

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。