机器学习与图像检索技术:聚类嵌套二分法与重排序聚合方法
在当今的技术领域,机器学习和图像检索是两个备受关注的方向。本文将深入探讨聚类嵌套二分法在分类问题中的应用,以及重排序和排名聚合方法在基于内容的图像检索(CBIR)系统中的创新结合,旨在为相关领域的研究和实践提供有价值的参考。
聚类嵌套二分法的分类应用
在分类问题中,提出了三种非随机构建嵌套二分法的方法,分别是NDC、NDCR和NDCA。这些方法的核心思想是在树的上层分离容易区分的类别,在下层分离较难区分的类别。
- NDC方法 :通过计算类中心之间的距离对类别进行聚类,以此确定哪些类别更容易分离。
- NDCR方法 :除了考虑类中心之间的距离外,还考虑每个类别的半径,试图判断类别之间是否存在重叠。
- NDCA方法 :用类中心与类内所有其他元素之间的平均距离代替每个类别的半径。
为了验证这些方法的有效性,进行了关于单个嵌套二分法和嵌套二分法集成的实验。实验使用了不同的基分类器,包括C4.5、RandomForest、1 - NN、3 - NN和Naive Bayes,并对Bagging、AdaBoost和MultiBoost等集成方法也进行了测试。实验结果如下表所示:
|方法|基分类器|NDC|NDCR|NDCA|ND|ND - DB|ND - CB|
| ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
|无集成|C4.5|88.81|88.58|88.48|87.22|87.63|88.0
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



