聚类方法之DBSCAN

DBSCAN是一种基于密度的聚类方法,通过Eps邻域和MinPts参数找到核心点、边界点和噪声点。算法流程包括寻找核心点形成集合,然后通过密度可达和密度相连构建聚类簇。优点是无需预设簇数量,对噪声不敏感,能识别任意形状的簇。缺点是大数据集下I/O开销大,且对聚类间差距大的场景效果不佳。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

算法思想

DBSCAN是一种基于密度的聚类方法,其思想是根据样本间的紧密程度来对簇进行划分。

DBSCAN的样本点一般被分为三类:
1.核心点:
在半径Eps内含有超过MinPts数目的点
2.边界点:
在半径Eps内含有的点不超过MinPts,但是落在核心点领域内的点
3.噪声点:
既不是核心点也不是噪声点的点。
这里有两个参数需要人为指定:半径长度Eps 和 点的数据MinPts

这里写图片描述
如图所示,绿色的为核心点,蓝色的为边界点,红色的为噪声点。

关于样本点构成的一些其他概念:
1.Eps邻域
假设样本点p在数据集内,Eps领域即指的是数据集中离样本p的距离小于等于Eps的样本点的集合。
2.密度直达
假设有样本点p,q。其中p是核心点,q在p的Eps邻域内,则p,q密度直达。
3.密度可达
对于对象链:p_1,p_2……p_n,p_(i+1),是从p_i关于Eps和MinPts直接密度可达的,则对象p_n是从对象p_i关于Eps和MinPts密度可达的。
4.密度相连
对于样本点p、q,若存在样本点k使得p、q均由k密度可达,则称p,q密度相连

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值