层次聚类 Python 实现——从原理到代码实现

最新推荐文章于 2025-06-22 11:06:15 发布

TechGlide

最新推荐文章于 2025-06-22 11:06:15 发布

阅读量377

点赞数 1

CC 4.0 BY-SA版权

文章标签：聚类 python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/TechGlide/article/details/132219982

Python 专栏收录该内容

112 篇文章 ¥59.90 ¥99.00

订阅专栏

本文介绍了层次聚类算法的原理，重点讲述了凝聚型层次聚类，并提供了使用Python实现的详细步骤，包括载入数据、计算距离矩阵、构建聚类树和簇划分，通过Iris数据集展示了层次聚类的过程。

层次聚类 Python 实现——从原理到代码实现

层次聚类（hierarchical clustering）是一种将数据点逐步分组的聚类算法。与其他聚类算法不同的是，它不需要预先设置聚类数目，而是通过聚类树来展示数据点间的相似程度，并自下而上构建出聚类结果。本篇文章将从原理入手，介绍了层次聚类算法，并使用 Python 实现。

层次聚类算法简介

层次聚类算法主要分为两种：凝聚型（Agglomerative Clustering）和分裂型（Divisive Clustering）。本篇文章主要介绍凝聚型层次聚类算法。

凝聚型层次聚类算法的基本思想是将所有的数据点都看作一个簇，然后逐渐合并簇，直到所有数据点都被合并成为一个簇。具体而言，在该算法中，我们首先将每个数据点视为一个独立的簇，之后在每次聚合中选择距离最近的两个簇，合并成一个新的簇，并更新距离矩阵。直至最终得到包含所有数据点的簇集合。

层次聚类算法实现

接下来，我们将使用 Python 实现凝聚型层次聚类算法，并以 Iris 数据集为例进行演示。

载入数据

首先，我们载入所需的库，并读入 Iris 数据集。

import pandas as pd
from sklearn

了解本专栏

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。