无监督学习与神经网络工具包技术详解
1. 层次聚类(Hierarchical Clustering)
层次聚类,也称为层次聚类分析,是一种将相似对象分组到称为簇的组中的算法。最终会得到一组簇,每个簇与其他簇不同,并且每个簇内的对象大致相似。
操作步骤
- 打开名为
Chapter-006-008-Hierarchical-clustering-01.ipynb的 Jupyter 笔记本。 - 选择用于计算链接的度量,可从 “Euclidean”、“l1”、“l2”、“manhattan”、“cosine” 中选择。
- 选择链接准则,不同的链接准则控制着如何计算观测集之间的距离,算法会合并使该准则最小化的簇对:
- Ward:最小化合并簇的方差。
- Average:使用两组中每个观测值距离的平均值。
- Complete 或 maximum linkage:使用两组中所有观测值之间的最大距离。
- Single:使用两组中所有观测值之间的最小距离。
影响分析
不同的参数对聚类的成功有积极或消极的影响。可以通过打开 Chapter-009-009-Hierarchical-clustering-02.ipynb 、 Chapter-009-010-Hierarchical-clustering-02.ipynb 和 Chapter-009-
超级会员免费看
订阅专栏 解锁全文
3万+

被折叠的 条评论
为什么被折叠?



