机器学习--聚类算法(第二篇:DBSCAN算法)

#前言

  本篇博客继上一篇聚类算法的介绍,给大家再介绍一种功能更为强大的聚类算法--DBSCAN算法,这也是目前市面上较为流行的一种聚类算法,相较于K-MEANS算法,个人认为它功能更加全面,使用范围和使用效果更好!接下来我就对此算法进行一个简单的介绍。

#DBSCAN算法相关的基本概念介绍

1.核心对象:若某个点的密度达到算法设定的阈值则其为核心点。

\varepsilon-领域的距离阈值:设定的半径r。

  以上这两个概念需要综合起来来理解,我们的算法会依据我们输入的两个参数(最小密度:也就是在特定范围内目标的个数,特定范围的半径)遍历每一个点,将符合两个参数的点设置为核心对象

2.直接密度可达:若某点p在点q的r邻域内,且q是核心点则p-q直接密度可达。

密度可达:若有一个点的序列q0、q1、.qk,对任意qi-qi-1是直接密度可达的,则称从q0到qk密度可达,这实际上是直接密度可达的“传播”。

  直接密度可达其实很好理解,就是如果非核心对象与其所属核心对象之间的关系,通俗来讲就是一个点在另一个点的领域内,那么该点与该范围的核心对象之间就是直接密度可达。

  密度可达有点类似于我们以前所学过的传递性,一个点可以同时为多个特定范围核心对象的直接密度可达点,而这些核心对象之间就是密度可达。

3.密度相连:若从某核心点P出发,点q和点k都是密度可达的,则称点q和点k是密度相连的。

4.边界点:我们上面说过这种密度可达的传递行,当我们遍历到某个点,将其作为核心对象时发现已经不符合特定领域内的最小的目标阈值了,那么此时我们说这个点就是边界点。

5.噪声点(或者说是离群点):即没有被任何一个领域所包括的点,这也就是DBSCAN算法可以用于噪声监测的原因。

#DBSCAN算法模型的原理流程介绍:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值