10、数据聚类算法：从密度到图论的全面解析

最新推荐文章于 2025-09-10 15:14:27 发布

异步汪仔

最新推荐文章于 2025-09-10 15:14:27 发布

阅读量24

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习赋能机器人视觉文章标签：密度聚类图聚类谱聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/d3e4f/article/details/151991289

机器学习赋能机器人视觉专栏收录该内容

36 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据聚类算法：从密度到图论的全面解析

1. 密度聚类算法

密度聚类算法在处理具有高斯分布的数据时，往往不如像 EM 聚类这样能精确建模此类数据的方法。不过，也有一些更复杂的密度聚类方法：
- DENCLUE ：使用核密度估计的梯度上升来创建聚类的基本单元。
- DeLiClu ：于 2006 年提出，旨在完全消除 ε 参数。它结合了单链接聚类和 OPTICS 的思想，并通过使用 R - 树索引，在性能上优于 OPTICS。
- LDBSCAN ：2007 年提出，结合了局部离群点检测和 DBSCAN 的思想，用于处理不同密度的聚类。它利用基于 k - 最近邻的局部离群因子（LOF）来检测噪声点和离群点，能够发现数据空间不同区域中存在的不同密度的聚类。但它需要用户输入四个对聚类结果有显著影响且难以确定的参数。

2. 图聚类算法

图聚类算法可以将几乎任何类型的数据转换为相似性图进行分析。这种转换是通过邻域图来实现的，具体步骤如下：
1. 为数据集中的每个对象定义一个节点，形成包含 N 个节点的节点集，其中节点 i 对应对象 xi。
2. 如果对象 xi 和 xj 之间的距离 dist(xi, xj) 小于特定阈值，则在它们之间存在一条边。更好的方法是计算 xi 和 xj 的 k - 最近邻，当其中一个是另一个的 k - 最近邻时添加一条边。边 (i, j) 的权重 wij 等于对象 xi 和 xj 之间的距离，权重越大表示差异越大。

构建邻域图后，可以使用许多聚类算法对邻域图中的节点进行聚类，得到的

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。