基于快速 K 近邻的新型聚类算法性能评估
1. 算法概述
基于距离度量的聚类算法在数据挖掘领域具有重要地位。这里介绍一种新的基于数据点与其质心之间距离度量的密度聚类算法,该算法不预先指定固定数量的最近邻,而是让其可变以实现优化。其基本的 CDBSCAN 算法用于检索密度分离的聚类,具体算法如下:
Function Name: CDBSCAN-DeSCA
Input:
SetOfPoints // a set of N data points
NumofClusters // the number of clusters resulted
LabelOfPoints // a label array obtained in the first step
LIF // an array of local inlier factors for each data point
MinPts // an array with number of neighbors for each data point
LRD // a label array with Reachability distance for each data point
Output:
LabelOfPoints // an array of final labels for each data point
Begin
ClusterID := NumofClusters;
Ratios(NumofClusters, 0);
For (i
超级会员免费看
订阅专栏 解锁全文
978

被折叠的 条评论
为什么被折叠?



