模式分类中的多类分类与特征提取方法
在模式分类领域,多类分类和特征提取是两个关键的研究方向。本文将详细介绍几种常见的多类分类方法,以及如何通过特征提取来提高分类的准确性。
1. 多类分类方法
在多类分类问题中,常见的方法有一对一(One Versus One)、一对其余(One Versus Rest)、多类铰链损失(Multiclass Hinge Loss)和多项式逻辑函数(Multinomial Logistic Function)等。下面将对这些方法进行详细介绍。
1.1 一对一(One Versus One)
一对一方法考虑数据集中所有无序的类对,并为每一对拟合一个单独的二元分类器。对于一个输入样本,通过计算每个二元分类器产生的投票的多数来进行分类。例如,在一个四类分类问题中,需要训练 $C_{4}^2 = 6$ 个分类器。然而,这种方法可能会出现投票平局的情况,导致无法对样本进行分类。例如,对于一个未见过的样本,6 个分类器对 0、1、2 和 3 类的投票分别为 1、1、2 和 2,此时 2 类和 3 类的票数相同,无法确定样本的类别。此外,一对一方法在类别数量较多的应用中不太实用,因为需要训练的分类器数量会随着类别数量的增加而迅速增加。
1.2 一对其余(One Versus Rest)
一对其余方法也称为一对所有(One Versus All)或一抗所有(One Against All)方法。与一对一方法不同,对于一个 $N$ 类分类问题,一对其余方法只训练 $N$ 个二元分类器。具体来说,对于每个类别 $a$,创建一个二元数据集 $X_{a|rest}$,其中包含所有标签为 $a$ 的样本,标签
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



