多视图聚类与多视图模型详解
1. 引言
1.1 聚类
聚类是一种无监督学习技术,用于发现数据集中的潜在结构。依据不同的测量方法,被划分到同一簇的数据对象基于其特征和特性具有相似的属性。根据每个数据对象与簇的关系,聚类算法可分为硬聚类和模糊聚类。
模糊聚类算法通常比一些硬聚类算法能实现更好的聚类质量。例如,Bezdek 等人提出了模糊 C 均值聚类(FCM),引入了重叠聚类和模糊隶属度的概念,实验表明 FCM 比 K - 均值硬聚类技术性能更优。M. Hanmandlua 等人提出了模糊协同聚类(FCCI),通过对像素和 R、B、G 颜色分量进行协同聚类来提高彩色图像分割的质量,实验结果显示 FCCI 比 FCM 和其他一些提出的聚类算法性能更好。Ngo Thanh Long 等人提出了区间值模糊协同聚类(IVFCoC),通过集成 2 型模糊系统的先进技术来识别数据中的不确定性并提高聚类质量。还有一些工作通过将特征加权熵集成到模糊聚类目标函数中,提出了特征约简方案,以计算并去除权重较小的特征,在多特征数据集和高光谱图像上的实验结果证明了该算法的出色性能。
聚类常用于分类、诊断和预测问题,如模式识别、决策支持、图像分析、信息检索等。与传统数据分析方法相比,聚类算法的突出优势在于计算复杂度不高,但在不确定数据集上具有更高的准确性。然而,像其他数据处理方法一样,传统聚类方法在处理此类大型数据集时表现不佳。随着从不同来源收集的数据呈指数级增长,分析和组织数据已成为大数据处理中的重要挑战。
1.2 多视图聚类
由于信息技术应用的发展,尤其是人工智能的发展,从多个来源和多媒体收集数据的需求不断增加。单向、单源的数据处理技术由于
超级会员免费看
订阅专栏 解锁全文
829

被折叠的 条评论
为什么被折叠?



