Density Peaks聚类算法

这篇文献笔记介绍了Density Peaks Algorithm(DP算法),该算法假设聚类中心由低局部密度点包围,且这些点远离高密度点。算法计算每个点的局部密度和距离高密度点的距离,通过这两个参数识别异常点并确定聚类中心。聚类过程包括计算密度和距离向量,选择高密度-远距离点作为中心,然后按密度传播确定类别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近看了一篇关于基于密度的聚类算法---Density Peaks Algortihm, 把自己对该聚类算法的理解,写在这篇文献笔记中。

一、算法思想

     这个DP算法假设聚类中心被较低局部密度的点所围绕,并且这些点距离具有较高局部密度的点有相对更大的距离。因此,对于数据集中的任何数据点i, DP算法计算出两个参数值:

      (1) 局部密度

      计算局部密度需要一个距离阈值 , 局部密度就是距离某点i的距离小于距离阈值的所有点的数量。在文献中推荐设置阈值已保证局部密度在样本总数的1%-5%之间。

      (2) 点i距离高局部密度点的距离

       点i距离高局部密

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值