关联规则挖掘与图挖掘中的高效策略
在数据挖掘领域,寻找有趣的关联规则和判别性子图是重要的研究方向。前者有助于从大规模规则集中发现有价值的信息,后者则对构建图分类模型具有重要意义。
关联规则挖掘新方法
以往,在大规模规则集中寻找有趣规则时,许多方法聚焦于挑选一两个最适合应用领域的度量,并分别处理这些度量。而现在提出了一种新方法,旨在聚合各种度量,以同时满足多个视角来寻找规则。
该方法选用了Choquet积分作为合适的聚合算子,并基于数据构建容量,从而考虑度量之间的依赖关系。通过在不同性质的规则集上进行实验,发现Choquet积分的行为会随规则集的不同而变化,因为度量之间的相关系数依赖于上下文。不过,大多数有趣规则的特征仍较为相似,这反映了每个组中度量的观点。
度量聚合减轻了度量选择的负担,但用户仍需考虑使用哪些度量,因为不合适的度量可能会使聚合结果产生偏差。这种聚合方法已被纳入ARQAT框架。后续研究可致力于寻找更复杂的有趣性度量之间的相似性度量,以替代线性相关性;基于用户意见而非数据来构建容量也是一个有趣的方向。
图挖掘中的Cl - GBI算法
近年来,图挖掘研究众多,尤其是挖掘图结构数据中的频繁子图。Chunkingless Graph - Based Induction(Cl - GBI)是一种图挖掘算法,它能从带有类标签的图结构数据中找到判别性子图,构建分类模型。
Cl - GBI是Graph Based Induction(GBI)的扩展,与GBI及其另一个扩展Beam - wise GBI(B - GBI)类似,基于逐步对扩展原则从图结构数据中提取典型子图。但Cl - GBI不进行实际的
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



