16、机器学习中的聚类、降维与深度学习基础

最新推荐文章于 2025-12-01 17:46:36 发布

happy2

最新推荐文章于 2025-12-01 17:46:36 发布

阅读量16

点赞数

CC 4.0 BY-SA版权

分类专栏： GCP机器学习实战指南文章标签：聚类层次聚类 K-means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/happy2/article/details/154156722

GCP机器学习实战指南专栏收录该内容

31 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

机器学习中的聚类、降维与深度学习基础

1. 聚类算法

聚类算法是机器学习中用于将数据集中的样本划分为不同组或类别的重要方法。常见的聚类算法有K-means和层次聚类。

1.1 K-means聚类

在绘制K-means算法的聚类标签和聚类中心时，相关代码应在同一个笔记本中执行。K-means算法通过预先指定聚类的数量K，将数据集划分为K个不同的簇。

1.2 层次聚类

层次聚类是另一种聚类算法，它不需要在运行算法前预先假设数据集中的聚类数量。层次聚类主要有两种技术：
- 自底向上（凝聚式） ：初始时，每个数据点都被指定为一个单独的聚类，然后根据某种距离度量确定的同质性，迭代地合并聚类。
- 自顶向下（分裂式） ：从一个包含所有数据点的聚类开始，随后将其分裂成同质的子组。

层次聚类会创建一个树状的分区表示，称为树状图（dendrogram）。树状图类似于二叉树，根在顶部，叶子在底部，叶子代表数据样本。

聚类的形成是通过计算每对数据点之间的接近度，最常用的接近度度量是欧几里得距离。从树状图的叶子开始，迭代地合并在多维向量空间中彼此更接近的数据点，直到所有同质点都被放入一个组或聚类中。

在层次聚类中，用于评估两个聚类之间差异的概念称为相异度，通过不同的链接方式（linkage）来计算。主要有以下四种链接方式：
| 链接方式 | 描述 |
| — | — |
| 质心链接（centroid） | 使用聚类的几何质心计算两个聚类之间的相异度 |
| 完全

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。