聚类算法性能研究与新型K近邻聚类算法
1. 聚类算法性能研究
1.1 算法代码与实验环境
首先给出一段代码,它实现了某种聚类标签分配的功能:
for i=1: indexNew.size()
labelFinal(indexNew(i)) = T(i);
end for
for j=1:k
for each point p of data
if (labelFinal[p]>0) continue;
if (labelFinal[p.jNN]>0)
labelFinal[p]= labelFinal[p.jNN]
end if
end for
end for
return labelFinal;
这里 q.kNN 是 q 的第 k 小距离, Distance(q, p) 用于计算 q 和 p 之间的距离。所有算法都在 Matlab 中实现,实验在配备 Intel Core 2 Duo Processor E6550 2.33 GHz CPU 和 2 GB RAM 的计算机上进行,操作系统为 Windows 10。
1.2 小真实数据集上的性能
在这个实验中,使用了从 UCI 机器学习库获取的八个小真实数据集,数据集信息如下表所示:
| 数据名称 | 大小 |
超级会员免费看
订阅专栏 解锁全文

638

被折叠的 条评论
为什么被折叠?



