简洁最小生成器系统与等价关系闭包系统研究
在数据挖掘领域,对于数据的有效表示和处理一直是重要的研究方向。本文将围绕简洁最小生成器系统(SSMG)以及等价关系闭包系统展开深入探讨,通过理论分析和实验研究,揭示它们在数据处理中的重要作用。
简洁最小生成器系统(SSMG)
- SSMG的性质 :新定义的SSMG能够确保对每个冗余最小生成器(MG)的推断。因为冗余MG不是其σ - 等价类中最小的,根据σ - 等价类的定义,必然存在属于SSMG的简洁MG,通过替换过程可以得到该冗余MG。这表明新的SSMG是MG集的精确表示。
- 相关工作 - 克隆项概念 :克隆项可大致看作是将SSMG限制到γ - 等价类,即两个或多个具有相同闭包的项,类似于大小为1的MG。对于像(a, b)这样的项对,a和b存在对称性,这可视为冗余信息。因此,在不损失信息的情况下,可以忽略所有包含“b”但不包含“a”的规则。这种约简过程被应用于Guigues - Duquenne精确蕴含基,该基的关联规则在前提部分呈现伪闭项集之间的蕴含关系,在结论部分呈现闭项集。当克隆项应用于伪闭项集时,被称为P - 克隆项。
- 实验研究
- 数据集选择 :为了评估SSMG方法的实用性,在四个常用的基准数据集上进行了一系列实验,这些数据集的特征如下表所示:
| 数据集 | 项目数量 | 对象数量 | 平均对象大小 | 最小支持度区间(%) |
| ---- | ---- | ---- | ---- | ---
- 数据集选择 :为了评估SSMG方法的实用性,在四个常用的基准数据集上进行了一系列实验,这些数据集的特征如下表所示:
超级会员免费看
订阅专栏 解锁全文
171万+

被折叠的 条评论
为什么被折叠?



