1.综述
常见的聚类算法可分为三类:
1. 中心探索法:反复迭代计算簇中心的距离,直至在设定的阈值范围内的聚类算法。根据中心的不同定义,又可分为K-Means,K-Medoids,K-Medians及模糊聚类(fuzzy clustering)。
2. 树形构造器:先后合并相互距离比较近的类,使其形成一个较大的类,直到最后只有一个。这种方法即为”阶层式聚类”(agglomerative hierarchical clustering),它最终形成一个树状的类。
3. 邻居生长器:它将彼此”足够接近的”数据点连接在一起形成一个簇,直至所有点都被分类。常用的有DBSCAN,OPTICS及DENCLUE算法。
其中邻居生长器又是一种基于密度的聚类算法(Density-Based Clustering Methods),本博客主要介绍邻居生长器的DBSCAN及OPTICS算法。
2.DBSCAN
2.1 名词定义
- ε 邻域:p 及
q 是数据集中的两个点,点q 属于点p 的

本文深入探讨了基于密度的聚类算法,重点介绍了DBSCAN和OPTICS。DBSCAN通过ε邻域和MinPts定义核心点、边界点,形成密度可达和密度连接的概念。OPTICS则引入核心距离和可达距离,提供更灵活的聚类结构分析。内容涵盖名词定义和算法流程。
最低0.47元/天 解锁文章
5488

被折叠的 条评论
为什么被折叠?



