聚类、特征选择与分类在机器学习中的应用与挑战
1. 聚类的应用
聚类是一种无监督学习方法,在多个领域有着广泛的应用:
- 图像分割 :层次聚类和 k - 均值聚类方法在图像分割中应用广泛。例如,MRI 图像分割在手术准备和异常识别等医疗应用中至关重要,其目标是根据特定图像属性将输入图像划分为重要的结构部分,有时可将其表述为聚类问题。具体操作是先通过转换图像维度获得一组特征向量,然后将像素位置聚类成一些结构。
- 生物信息学 :近年来,基因表达数据聚类推动了基因组测序和 DNA 项目的发展。生物信息学的应用基于具有相似模式或基本序列结构的可比基因或蛋白质。
- 目标识别 :目标识别中的聚类将数据对象的视图进行分组,每个待识别的对象会在该对象的各种图像库中进行特征描述。
- 字符识别 :字符识别中的聚类用于检测给定手写文本中的词位,以实现与书写者无关的手写识别。该系统的效果主要取决于用户的接受率,但需要大量的训练数据。
- 信息检索(IR) :与重要文档的自动存储和检索相关。许多教育机构在其图书馆系统中采用 IR 方案,以便用户轻松访问书籍、文章和期刊相关文档。
- 数据挖掘和大数据 :从海量数据库中提取知识。数据挖掘技术对关系型、空间型、大型、无形状和事务型数据库都有益。由于数据集规模超出模型容量,大规模数据挖掘是新兴话题之一。聚类有助于聚合从非格式化示例中收集的相似数据实例,Hadoop 是大数据处理工具之一。
-
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



