Galois格与MGK有效关联规则的基
在数据挖掘领域,关联规则挖掘是一项重要的任务,它能够揭示数据集中频繁共同出现的属性或属性值之间的关系。然而,挖掘出的有效关联规则数量往往非常庞大,其中包含了许多冗余和琐碎的规则。为了解决这个问题,我们可以通过生成规则基来减少规则的数量,同时保留所有有效规则的信息。本文将介绍关联规则、质量度量、Galois格的基本概念,并探讨MGK有效关联规则的基。
1. 关联规则、质量度量与Galois格
1.1 关联规则
我们在二元上下文 $(E, V)$ 的框架下进行研究,其中 $E$ 是有限实体集,$V$ 是定义在 $E$ 上的有限布尔变量(或项)集。$V$ 的子集称为项集,如果实体 “$e$” 满足 $x(e) = 1$,则称实体 “$e$” 包含项 “$x$”。
关联规则是 $(E, V)$ 的一个有序项集对 $(X, Y)$,记为 $X→Y$,其中 $Y$ 不能为空。$X$ 和 $Y$ 分别称为关联规则 $X→Y$ 的 “前提” 和 “结论”。
对于项集 $X$,$X’$ 表示包含 $X$ 中所有项的实体集,即 $X’ = {e ∈ E : ∀x ∈ X[x(e) = 1]}$;$\overline{X}$ 表示 $X$ 的否定,即 $\overline{X}(e) = 1$ 当且仅当存在 $x ∈ X$ 使得 $x(e) = 0$,且 $\overline{X}’ = E \ X’$。
例如,表 1 展示了一个二元上下文 $K = (E, V)$,其中 $E = {e1, e2, e3, e4, e5}$,$V = {A, B, C, D, E}$。若 $X = {B, C}$,
超级会员免费看
订阅专栏 解锁全文
582

被折叠的 条评论
为什么被折叠?



