基于类覆盖捕获有向图的快速分类算法
在数据分类领域,传统的非参数统计模式识别算法往往在性能和复杂度之间存在权衡。本文将介绍一种基于类覆盖捕获有向图(CCCD)的分类方法,它能在一定程度上解决复杂度问题,同时提供有效的分类性能。
1. 引言
在分类问题中,我们通常有来自两个不同类别的对象的测量数据。例如,不同种类猿的头骨测量数据、健康人和特定疾病患者的血液化学测量数据、水雷和类似水雷物体的声纳回波测量数据等。我们将来自一类的对象标记为类别 0,另一类标记为类别 1。分类器是一个函数,它根据训练数据和新的未知类别测量数据,返回一个类别标签(0 或 1)。
构建分类器的常见方法有:
- 最近邻法 :新观测最接近的训练观测提供类别标签。
- k - 最近邻分类器 :在 k 个最接近的训练观测中投票决定类别。
- 概率密度估计法 :估计不同类别的概率密度,并使用似然比检验来确定新观测的类别。
- 直接估计决策区域法 :尝试直接估计决策区域。
本文介绍的分类器通过用相对少量的球覆盖每个类别的支持集来估计类别,它从所有观测的完整覆盖中选择一个子集,以降低覆盖的复杂度,有点类似于简化的最近邻分类器。然而,这类分类器的复杂度通常为 $O(n^2)$,对于非常大的数据集,构建分类器所需的计算资源是巨大的。因此,我们需要近似算法,使其能在接近 $O(n)$ 的时间内产生一个好的分类器。
2. 类覆盖捕获有向图
类覆盖捕获有向图(CCCD)是一个随机图
超级会员免费看
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



