Science论文"Clustering by fast search and find of density peaks"学习笔记

最新推荐文章于 2025-05-07 18:43:26 发布

原创

最新推荐文章于 2025-05-07 18:43:26 发布 · 3.3w 阅读

·

18

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #数据挖掘 #Clustering Algorithm

本文介绍了《Science》期刊上提出的密度峰值聚类算法，该算法基于点的局部密度和到更高密度点的距离进行聚类。算法通过计算每个点的局部密度和最远高密度邻点距离，确定类簇中心。实验表明，该算法具有很好的鲁棒性和聚类效果。

"Clustering by fast search and find of density peaks"是今年6月份在《Science》期刊上发表的的一篇论文，论文中提出了一种非常巧妙的聚类算法。经过几天的努力，终于用python实现了文中的算法，下面与大家分享一下自己对算法的理解及实现过程中遇到的问题和解决办法。

首先，该算法是基于这样的假设：类簇中心被具有较低局部密度的邻居点包围，且与具有更高密度的任何点有相对较大的距离。对于每一个数据点 $i$ ，要计算两个量：点的局部密度 $_{\rho_{i}}$ 和该点到具有更高局部密度的点的距离 $_{\delta _{i}}$ ，而这两个值都取决于数据点间的距离 $_{d_{ij}}$ 。

数据点 $i$ 的局部密度 $_{\rho_{i}}$ 定义为式(1)：

$\rho _{i}=\sum_{j}\chi \left ( d_{ij}-d_{c} \right )$

其中，如果

最低0.47元/天解锁文章

评论 126

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。