强化概念格与多任务归纳数据库VINLEN:原理、实验与展望
1. 强化概念格相关算法研究
在数据挖掘领域,高效地挖掘闭合项集和构建概念格是重要的研究方向。CLearner作为一种增量算法,在这方面展现出了独特的优势。
传统的一些算法会按对应意图大小的升序对项集进行排序并逐一检查,而CLearner算法仅考虑当前事务的超集(待拆分)或子集。将CLearner算法与其他现有先进算法进行直接比较,可能会揭示出这些算法在特定问题上的潜在权衡。不过,对CLearner算法与其他挖掘算法进行详细的实验和比较,仍是未来研究的一个课题。
为了评估CLearner的性能,研究人员选择了CHARM和T.Mielikainen提出的算法作为对比。需要注意的是,CHARM算法并不构建概念格,只是输出闭合项集。因此,研究人员还将CLearner与一种基于CHARM结果在第二步重建概念格的方法(标记为Second - Step)进行了比较。
实验选用了两个非常密集的数据集:mushroom和connect,它们均来自FIMI存储库。mushroom数据集包含8124个事务,每个事务平均有23个项;connect数据集包含675570个事务,每个事务平均有43个项。所有测试都在配备512MB内存的Intel(R) Pentium(R)M处理器上运行Debian Linux 3.0系统进行,算法使用C++编码。
由于CLearner算法的运行时间和内存使用主要取决于计算的闭合项集总数,研究人员测试了在读取数据集过程中闭合项集数量的增长情况。结果表明,CLearner在构建概念格时,仅需对给定数据集进行一次扫描。同时,为了加速在概念格中的搜索,还使用了AMap和IMap这两
超级会员免费看
订阅专栏 解锁全文
34

被折叠的 条评论
为什么被折叠?



