基于属性项的挖掘算法:Pix与Mapix的原理、应用及性能分析
1. 引言
在数据挖掘领域,挖掘属性项对于发现数据中的潜在模式和知识至关重要。Pix和Mapix算法是用于收集属性项和挖掘频繁项集的有效工具。本文将详细介绍这两种算法的原理、实现步骤,并通过实验验证其性能。
2. 相关引理
2.1 引理2
设 (T) 为目标实例集,(I_1) 和 (I_2) 为项,(IS = {I_1, I_2}) 为项集,则有:
({e \in E | e \text{ 拥有 } IS} = {e \in T | e \text{ 拥有 } I_1} \cap {e \in T | e \text{ 拥有 } I_2})
证明过程表明,当 (e) 拥有 (IS) 时,(IS(e)) 成功,这意味着 (I_1(e)) 和 (I_2(e)) 也成功;反之,若 (e) 拥有 (I_1) 和 (I_2),则 (IS(e)) 也成功。
2.2 其他引理
还包括关于项和项集的一些性质引理,如:
- 引理6:每个至少有一个路径文字的项,其主体中没有仅包含头部变量的文字。
- 引理7:若 (IS_1 \preceq IS_2),则 (IS_1 \preceq I) 对于任何 (I \in IS_2) 成立。
- 引理8:若 (IS \preceq J),则存在 (I \in IS) 使得 (I \preceq J)。
- 引理9:若 (U) 中的项对不存在包含关系,则项集 (IS_1) 和 (IS_2) 不相等时,它们也不存在包含等价关系。
Pix与Mapix算法原理及性能分析
超级会员免费看
订阅专栏 解锁全文
5748

被折叠的 条评论
为什么被折叠?



