Apriori算法
一、关联规则挖掘问题可以这样来表述:设I={i1, i2···im}是一个项目集合,T={t1, t2···tn}是一个(数据库)事务集合,其中每个事务ti是一个项目集合,并满足ti⊆I。
一个关联规则是一个如下形式的蕴涵关系,
二、支持度和置信度是两个常用的衡量关联规则强度的指标
支持度:

置信度:

支持度是一个很有用的评价指标,如果它的值太小了,则表明相应的规则很可能只是偶然发生的。
置信度决定了规则的可预测度。如果一条规则的置信度太低,那