基于遗传算法的关联规则聚类标签方法研究
1. 引言
在关联规则聚类领域,对于聚类方法性能的评估缺乏完善的评价体系。现有一些方法在不同的评估指标下表现各异,难以在多个指标上同时取得良好效果。为解决这一问题,本文提出了一种名为GLM(Genetic Labeling Method)的遗传算法方法,用于关联规则聚类的标签标注,旨在平衡精度(Precision)和重复频率(Repetition Frequency)这两个评估指标的值。
2. 背景知识
2.1 关联聚类
不同的聚类策略被用于关联规则的后处理:
- 文献[1] :通过划分和层次算法进行分组,使用基于交易的Jaccard相似度度量J.RT(r, s),并选择与组内其他规则最相似的规则中的项作为标签。
- 文献[2] :采用层次算法,使用基于规则项的Jaccard相似度度量J.RI(r, s),标签选择策略与文献[1]相同。
- 文献[4] :提出基于交易的相似度度量,使用密度算法进行聚类,但未提及标签的查找方法。
- 文献[3] :提出基于交易的相似度度量,使用层次算法进行聚类,并提出通过找到覆盖所有规则的模式来总结每个聚类。
目前尚未发现将标签方法和遗传算法结合用于关联规则聚类的相关研究。
2.2 标签方法
关联规则聚类相关论文对标签问题的研究较少。本文使用了以下四种标签方法进行对比分析:
- Labeling Met
超级会员免费看
订阅专栏 解锁全文
3207

被折叠的 条评论
为什么被折叠?



