分类聚类算法的抽象表示
聚类分析是无监督数据分析中常用的工具,广泛应用于信息检索、文本挖掘、数据探索和医学诊断等领域。它将数据点划分为不同的组,使得同一组内的元素彼此更相似。然而,当数据用分类属性描述时,聚类问题变得更具挑战性,因为难以建立分类属性之间的顺序关系。而且,用形式化方法表达分类聚类算法及相关问题的研究较少。
1. 研究背景与目标
- CCTree算法 :CCTree(分类聚类树)是一种具有决策树结构的算法,它根据属性或特征域的最大熵迭代地划分节点数据。树的叶子节点即为所需的聚类。特征在CCTree算法中起着关键作用,可用于唯一标识每个聚类。
- 抽象的概念 :抽象是一种数学概念,它将问题的原始(语义)表示映射到新的(语法)表示,通过去除不必要的细节,在保留某些理想属性的同时,使问题更易于处理。
2. 主要贡献
- 提出特征 - 聚类代数 :一种基于半环的形式化方法,用于抽象基于特征的聚类表示,其元素称为项。
- 证明特定项可完全抽象树结构 :在某些条件下,特征 - 聚类代数中的特定项能够完全抽象标记树结构,特别是CCTree。这保证了问题的语义和语法形式可以交替使用。
- 给出表示CCTree结构的条件 :提出了特征 - 聚类代数中项表示CCTree结构的条件和要求。
超级会员免费看
订阅专栏 解锁全文
2604

被折叠的 条评论
为什么被折叠?



