Apriori算法
一、关联规则挖掘问题可以这样来表述:设I={i1, i2···im}是一个项目集合,T={t1, t2···tn}是一个(数据库)事务集合,其中每个事务ti是一个项目集合,并满足ti⊆I。
一个关联规则是一个如下形式的蕴涵关系,

二、支持度和置信度是两个常用的衡量关联规则强度的指标
支持度:
置信度:

支持度是一个很有用的评价指标,如果它的值太小了,则表明相应的规则很可能只是偶然发生的。
置信度决定了规则的可预测度。如果一条规则的置信度太低,那么从

Apriori算法是关联规则挖掘中的一种经典算法,主要分为两步:生成所有频繁项目集(支持度高于minsup的项集)和从频繁项目集中产生可信关联规则(置信度大于minconf的规则)。该算法利用向下封闭属性来提高效率,确保项集及其非空子集的最小支持度。
最低0.47元/天 解锁文章
1400

被折叠的 条评论
为什么被折叠?



