高效挖掘稀有关联规则及定义栅格数据时空粒度
在数据挖掘领域,挖掘稀有关联规则和定义时空粒度是两个重要的研究方向。下面将分别介绍高效挖掘稀有关联规则的方法以及栅格数据时空粒度的定义。
高效挖掘稀有关联规则
在挖掘稀有关联规则方面,最大约束模型是一种有效的模型,但由于仅存在类似Apriori的方法,使用该模型挖掘稀有关联规则(或频繁模式)会产生性能问题。为此,提出了一种类似FP - growth的高效方法,即MCCFP - growth。
通过在合成数据集和真实世界数据集上进行实验,对比了Apriori - like和MCCFP - growth的运行时间,结果如下表所示:
|数据集类型|Apriori - like运行时间(秒)| MCCFP - growth运行时间(秒)|
| ---- | ---- | ---- |
|合成数据集| - | - |
|真实世界数据集| - | - |
同时,在T10I4D100k和Retail数据集上,分别展示了使用单最小支持度框架(minsup = 0.1%)、最小约束模型(MinCM)和最大约束模型(MaxCM)生成的频繁模式数量。从实验结果可以观察到,当a值不是太大时,最大约束模型显著减少了频繁模式的数量;当a值变大时,该方法找到的频繁模式数量接近单最小支持度方法(Apriori)。原因是当a变大时,越来越多项目的MIS值达到LS。
以下为实验流程的mermaid流程图:
graph LR
A[选择数据集] --> B[设置参数]
B --> C[运
超级会员免费看
订阅专栏 解锁全文
1351

被折叠的 条评论
为什么被折叠?



