30、密度聚类算法:DBSCAN与OPTICS详解

密度聚类算法:DBSCAN与OPTICS详解

1. 密度聚类简介

密度聚类旨在解决基于模型聚类的难题。它假定待聚类对象集源于高斯分布的混合,将聚类视为具有高对象密度的非相似度空间子集,这些高密度区域由低密度区域分隔。常见算法有DBSCAN、DENCLUE和OPTICS。该方法不预设聚类形状,且允许存在不属于任何聚类的噪声对象。

2. DBSCAN算法核心概念

2.1 核心、边界和噪声对象

  • 核心对象 :设 $D$ 是度量空间 $(S, d)$ 的子集,$B[x, \epsilon]$ 是以 $x$ 为中心、半径为 $\epsilon$ 的闭球,$B_D[x, \epsilon] = B[x, \epsilon] \cap D$。若 $|B_D[x, \epsilon]| \geq m$,则 $x$ 是 $(\epsilon, m)$ - 核心对象。
  • 边界对象 :若 $x$ 是核心对象,$y \in B_D[x, \epsilon]$ 且 $|B_D[y, \epsilon]| < m$,则 $y$ 是 $(\epsilon, m)$ - 边界对象。
  • 噪声对象 :既非核心对象也非边界对象的对象为 $(\epsilon, m)$ - 噪声对象。

例如,当 $\epsilon = 2$,$m = 6$ 时,若 $|B_D[x, 2]| = 8$,则 $x$ 是核心对象;若 $|B_D[s, 2]| = 5$,则 $s$ 是边界对象;若 $|B_D[

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值