"Clustering by fast search and find of density peaks"是今年6月份在《Science》期刊上发表的的一篇论文,论文中提出了一种非常巧妙的聚类算法。经过几天的努力,终于用python实现了文中的算法,下面与大家分享一下自己对算法的理解及实现过程中遇到的问题和解决办法。
首先,该算法是基于这样的假设:类簇中心被具有较低局部密度的邻居点包围,且与具有更高密度的任何点有相对较大的距离。对于每一个数据点,要计算两个量:点的局部密度
和该点到具有更高局部密度的点的距离
,而这两个值都取决于数据点间的距离
。
数据点的局部密度
定义为式(1):
其中,如果

本文介绍了《Science》期刊上提出的密度峰值聚类算法,该算法基于点的局部密度和到更高密度点的距离进行聚类。算法通过计算每个点的局部密度和最远高密度邻点距离,确定类簇中心。实验表明,该算法具有很好的鲁棒性和聚类效果。
最低0.47元/天 解锁文章
4139

被折叠的 条评论
为什么被折叠?



