软约束挖掘范式的扩展:从理论到实践
1. 引言
在数据挖掘领域,挖掘有趣项集是一个重要的研究方向。本文将介绍基于软约束的挖掘范式,包括在概率半环、加权半环上挖掘 λ - 有趣项集,以及挖掘 top - k 项集的方法,并阐述这些方法在 ConQueSt 归纳数据库系统中的应用。
2. 挖掘基础:c - 半环性质与 λ - 有趣问题求解
在 c - 半环 (S = ⟨A, +, ×, 0, 1⟩) 中,× 运算符具有扩展性,即对于所有 (a, b ∈A),有 (a×b ≤S a)。利用这一性质,我们可以轻松地从可能有趣的模式集中修剪掉一些模式。
2.1 命题 1
给定基于半环 (S) 的软约束组合 (\otimes C = C1 \otimes… \otimes Cn),对于任何模式 (p ∈P),有:
(\otimes C(p) ≥S λ ⇒∀i ∈{1,…, n} : Ci(p) ≥S λ)
证明:由 × 运算符的扩展性直接可得。
2.2 求解方法
计算所有 λ - 有趣模式可以通过解决一个清晰问题来实现。将半环级别低于 λ 的所有约束实例赋值为 false,将半环级别大于或等于 λ 的所有实例赋值为 true。如果一个模式不满足这些清晰约束的合取,那么它对于软约束也不会有趣。我们可以将每个软约束转换为相应的清晰约束,在挖掘计算中推动清晰约束以修剪无趣模式,并在需要时对清晰问题的解进行后处理,以去除其中的无趣模式。
3. 概率半环上的 λ - 有趣项集挖掘
3.1 概率约束与半环
概率约束满足问题(P
超级会员免费看
订阅专栏 解锁全文
1184

被折叠的 条评论
为什么被折叠?



