基于约束的模式挖掘与通过压缩进行模式集挖掘和使用
基于约束的模式挖掘
在数据挖掘领域,基于约束的模式挖掘是一个重要的研究方向。它旨在通过施加约束条件,从数据中挖掘出更有价值的模式。
算法与概念
- 见证者概念 :有研究引入了“见证者”的概念,这是一种用于测试约束满足性的项集,通过它可以为搜索空间的部分区域推导剪枝信息。基于见证者的挖掘涵盖了在(反)单调和可转换约束下的挖掘,还能处理额外的约束类以及约束的合取情况。
- D - Miner系统 :该系统将闭项集挖掘(形式概念分析)与约束相结合,为模式挖掘提供了新的思路。
- 项集挖掘的约束编程框架 :这个框架基于约束搜索和约束编程在人工智能领域的广泛研究。它表明之前讨论的挖掘任务可以用通用约束编程系统中的约束重新形式化,并且这些系统提供了约束传播的通用框架,便于组合不同的约束。
实现考虑
在实现基于约束的模式挖掘时,数据结构的选择至关重要。原则上,频繁项集挖掘文献中研究的所有不同数据结构都可以在此使用。例如:
- MaxMiner和DualMiner算法 :使用与Eclat最相似的数据垂直表示。
- FP - Bonsai算法 :使用FP - Trees。
研究表明,为了获得良好的运行时间,数据结构的选择很重要,但许多传播过程可以适应不同的数据表示,这两个方面可以认为是正交的。
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



