机器学习-----DBSCAN算法

原创

于 2025-08-13 15:23:03 发布 · 1.2k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #人工智能

一、DBSACAN与K-means：

我们刚入门时，大部分学的都是k-means聚类。当我们进行实例操作时，会发现k-means聚类方法有很大的局限性，它无法分离任意形状的数据集如下图。

该数据集对于k-means方法来说，有点过于强人所难了，但对DBSCAN来说，却是小菜一碟。下面我将向大家介绍DBSCAN算法的原理，以及代码是实现。

应用场景：适用于非凸形状聚类（如验证码识别、3D点云分割），解决k-means无法处理的复杂分布问题。

二、核心思想：

想象你在校园里发问卷：

ε-邻域：以你为中心，半径 ε 内的同学就是你的“直接朋友圈”。
核心点：如果你的直接朋友圈人数 ≥ min_samples，你就是“核心人物”，有资格成立社团。
边界点：你恰好在别人的朋友圈里，但自己朋友圈人数不够，只能算“编外成员”。
噪声点：既没资格成立社团，也不属于任何朋友圈，就是“独行侠”。

从图中可以看出：

A是核心对象：它可以感染3个点，半径就是ε阈值，

红色的点都可以独立感染3个点都可以叫做核心点

B、C：由于不能独立感染，有其他

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dlraba802

关注关注

35
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

机器学习--DBSCAN聚类算法详解

2201_75491841的博客

03-20

2947

DBSCAN（Density-Based Spatial Clustering of Applications with Noise）是一种基于密度的聚类算法，能够将高密度区域中的数据点划分为簇，并识别低密度区域中的噪声点。与K-Means等算法不同，DBSCAN不需要预先指定簇的数量，且能够发现任意形状的簇。DBSCAN是一种强大的基于密度的聚类算法，能够自动发现簇的数量、处理噪声数据并识别任意形状的簇。尽管DBSCAN对参数选择较为敏感，但通过合理调整参数，它仍然能够在许多实际应用中取得良好的效果。

【机器学习】（17） --DBSCAN聚类算法

m0_74896766的博客

08-31

2043

DBSCAN聚类算法是怎么实现的DBSCAN聚类算法不需要提前指定分几簇，它会自动分簇算法模型训练时会产生标签参数，训练数据本身是没有标签的聚类算法的评估通过轮廓系数来判断，范围[-1,1]，靠近1为合理。

参与评论您还未登录，请先登录后发表或查看评论

DBSCAN算法

Above the cloud

09-12

427

1.DBSCAN 1.基于密度的聚类算法-DBSCAN 如下的样本点,由样本点的分布可知,理想状态下，是把这些样本点分成四个聚类(四簇),即下图所示：但是例子中的样本点，如果采用K-means算法进行聚类分析，得到的聚类结果如左图所示(右图是使用DBSACAN算法得到的结果)： K-means算法：例子中的问题，我们发现使用K-Means算法已经不再适用，因为K-means算法是基于距离度量的一种算法，K-means的理想状态就是聚完类后，每个点都能离所属簇的质心距离最近。（如果去掉外面的圈圈，这

聚类算法--DBSCAN算法

m0_51260564的博客

03-23

6106

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个基于密度的聚类算法。算法把簇看作数据空间中由低密度区域分割开的高密度对象区域；将足够高密度的区域划为簇，可以在有噪音的数据集中发现任意形状的聚类。

DBSCAN算法介绍

m0_74086448的博客

07-10

3130

概念。

聚类分析算法——DBSCAN（密度聚类）算法详解

goTsHgo的博客

10-25

1万+

DBSCAN 是一种基于密度的聚类算法，特别适用于发现任意形状的簇，并且具有处理噪声点的能力。通过合理选择参数 ε 和minPts，它可以在空间数据分析、图像处理、异常检测等领域发挥重要作用。

机器学习-python-实验-DBSCAN-BIRCH-对比k-means model & 高斯混合模型

12-01

Anaconda不仅包括了Python解释器，还自带了数据科学常用的包，如NumPy、pandas、matplotlib以及scikit-learn等，极大地方便了数据处理、可视化和机器学习模型的构建。在进行聚类模型的实验时，可以利用Anaconda平台...

机器学习--聚类算法（第二篇：DBSCAN算法）

2401_82661791的博客

04-28

827

这里需要引入一个新的概念就是K距离，我们将某个对象确定为核心对象后，计算每一个点到该点的距离，然后找到突变点，以突变点上一个点的距离作为我们半径r的设定距离。在上图中，算法首先确定了一个核心对象即为A，那么与其直接密度可达的点就为A'，A''和A'''，再将以上三个点作为核心对象进行密度传递，直至BC两点后发现，BC无法满足最小密度阈值，也就成为了边界点，而N点不属于任何一个特定领域，那么他就是我们所谓的离群点或者噪声点。2.直接密度可达：若某点p在点q的r邻域内，且q是核心点则p-q直接密度可达。

论文研究-基于DBSCAN算法的Geolife人员位置分析 .pdf

08-16

基于DBSCAN算法的Geolife人员位置分析，唐志博，姜小荣，随着GPS服务设备和GPS数据集的增长，基于GPS数据的数据分析成为了一个研究热点。本文通过实验调整DBSACAN的聚类半径对微软亚洲研究院��

DBSCAN聚类算法

11-21

底层用C++写的，放在CPPcode文件夹里的是源码。通过matlab生成100个2d高斯点，存放为“points.txt”，然后调用exe程序读取、处理、输出分类结果为out.txt，matlab读取该文件并画出分类结果

DBSCAN详解

热门推荐

皮卡丘的情绪

07-26

8万+

一、基本概念 DBSCAN的基本概念可以用1，2，3，4来总结。 1个核心思想：基于密度直观效果上看，DBSCAN算法可以找到样本点的全部密集区域，并把这些密集区域当做一个一个的聚类簇。 2个算法参数：邻域半径R和最少点数目minpoints 这两个算法参数实际可以刻画什么叫密集——当邻域半径R内的点的个数大于最少点数目minpoints时，就是密集。 3种点的类别：核心点，边界点和噪声点邻域半径R内样本点的数量大于等于minpoints的点叫做核心点。不属于核心点但在某个核心点的邻域内的点叫做边界

异常值检验——Dbscan聚类

qq_59922536的博客

07-20

1327

最近在使用异常值检验这一块的内容，使用之后简单记录一下，使用Dbscan聚类识别异常值这个方法的问题在于eps和min_samplesz这两个参数需要调整。得看具体的数据。

DBSCAB算法介绍（Python3实现）

helloWorld的博客

04-26

3456

基于密度的空间聚类的应用(Density-based spatial clustering of applications with noise，DBSCAN)算法是由Martin Ester, Hans-Peter Kriegel, Jörg Sander和Xiaowei Xu于1996年提出的一种聚类分析算法。

大学生白话——DBSCAN 算法：让你秒懂的聚类神器

alxiu的博客

11-30

656

大家好，今天咱来唠唠一个聚类算法里听起来有点神秘兮兮，但实则趣味十足的家伙 ——DBSCAN。它的大名是 Density-Based Spatial Clustering of Applications with Noise，也就是 “基于密度的空间聚类应用”。通俗来讲，DBSCAN 就是个能把相似玩意儿归拢到一块儿的神奇算法，宛如一位热忱满满的聚会组织者，擅长将兴趣爱好相仿之人汇聚一处。

DBSCAN聚类算法的案例

嵌入式行业打工人，不定期更新博客。

08-14

732

DBSCAN（Density-Based Spatial Clustering of Applications with Noise）算法的案例，这是一种基于密度的聚类算法，特别适合处理具有不同形状和大小的数据簇，并且能够自动识别并排除噪声点。

Mask Scoring R-CNN论文解读

lunduai4750的博客

03-29

503

Mask Scoring R-CNN论文解读 人工智能大神何凯明的Mask R-CNN对实例分割做出了巨大的贡献，在2019年的CVPR会议中，一个基于Mask R-CNN的一个名为Mask Scoring R-CNN的网络提高了实例分割性能。大多数实例分割方法中，实例蒙板（instance mask）的分数与box-level的分类置信度共享，该置信度由运用在提议特征的分类器所...

DBSCAN 聚类

gengyanpeng's csdn blog

10-25

1205

DBSCAN原理简介 DBSCAN详细介绍及python实现 sci-kit learn提供了相应的类和API，非常方便简单。http://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html最简单的应用就是一句话： from sklearn.cluster import DBSCAN clf = DBSCAN

【机器学习】DBSCAN Algorithms基于密度的聚类算法

weixin_34049948的博客

06-20

1615

一、算法思想： DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同，它将簇定义为密度相连的点的最大集合，能够把具有足够高密度的区域划分为簇，并可在噪声的空间数据库中发现任意形状的聚类。 DBSCAN中的几个定义： ...

头歌机器学习 --- DBSCAN算法流程