基于粗糙集和最大相似度图的最近原型分类及分层弹性图匹配手势识别
1. 最近邻分类器问题及原型选择方法概述
最近邻(NN)分类器是模式识别中最流行的监督分类方法之一,但它存在两个重要缺点。一是高存储和计算要求,它需要存储整个训练集,占用大量空间,并且在确定新对象的类别时,需要将其与训练集中的每个原型进行比较。二是敏感性,NN分类规则对噪声和离群对象非常敏感。
为克服这些缺点,研究人员提出了原型选择方法,旨在获得一组用于分类的代表性对象(原型)的简化集合。这些技术分为原型选择和原型生成方法,前者从原始训练集中选取对象组成简化集,后者可能创建原始数据中不存在的人工原型。此外,NN分类器还面临处理混合和不完整数据的挑战,这类数据会影响大多数原型生成方法,因为它们缺乏向量空间的属性,一些基于数据空间几何属性的原型选择方法也不适用,因为对象是在笛卡尔空间而非度量空间中定义的。
原型选择方法又可分为基于误差的编辑方法和凝聚方法。编辑方法专注于去除噪声和离群对象,旨在平滑类边界,提高准确性;凝聚方法旨在减少冗余对象,获得尽可能小的训练集。将这两种技术结合可能会得到一个小的训练集,同时具有较高的分类器准确性。
2. 以往原型选择工作回顾
自最近邻分类器引入以来,减少训练集一直是模式识别和人工智能领域的活跃研究领域。在处理混合和不完整数据方面,减少训练集的方法可分为编辑方法和凝聚方法。
凝聚方法有多种,如最小一致集(MCS)、广义凝聚最近邻(GCNN)、原型相关性选择(PRS)、基于灰度的缩减(GBR1、GBR2)和CSESupport等。最近还提出了一些算法,如多实例学习和类边界保留(CBP)。
编辑方法通过去除噪