非线性聚类与群体智能聚类算法综述
1. 非线性聚类概述
非线性聚类是数据聚类领域中极为重要的研究问题。从基于核的聚类、多示例模型、基于图的方法以及支持向量聚类(SVC)等不同视角,有多种非线性聚类算法。其中,具体回顾了四种非线性聚类方法,分别是基于核聚类的COLL、MEAP、GMPCL和PSVC,计算机视觉领域的实验结果已证实了这些方法的有效性。
1.1 核方法面临的问题
对于基于核的方法(如COLL和PSVC),一个具有挑战性的问题是选择合适的核函数,将数据集从原始数据空间映射到高维核空间。不同的核变换会导致不同的聚类结果,无论采用何种聚类机制。通常,这个问题最常用的解决方法是试错法,但由于缺乏先验信息,这种方法并不适用。在无监督场景下的另一种策略是使用稳定性参数来选择合适的核函数,即选择能使结果域描述“最稳定”的核参数。
1.2 多示例/多原型方法的局限性
多示例/多原型方法仅适用于具有多个子簇的非线性可分簇的特殊情况。该假设意味着它们只关注非线性问题中数据点相对均匀的一小部分。然而,在许多实际应用中,如图像分类、人脸分类、多字体光学字符识别和手写数字分类,每个簇可能包含多个子簇。
例如,在自然场景分类实验中,一个场景类别通常包含多个“主题”,如街道场景可能包含“道路”“汽车”“行人”“建筑物”等主题;在人脸分类实验中,同一个人的不同面部表情的图像应视为不同的子簇;在光学字符识别和手写数字分类应用中,代表一个字母或数字的簇可能由几个子簇组成,每个子簇对应不同的风格或字体。显然,包含多个子簇的数据不能用单个示例/原型表示,而多示例/多原型模型则适用于这种情况。因此,除了上述回顾的多示例/多原型方法外,还开发了一
超级会员免费看
订阅专栏 解锁全文
856

被折叠的 条评论
为什么被折叠?



