1.2Apriori 算法
Apriori算法是挖掘关联规则的算法,是Agrawal等在1993年[1]设计的一个基本算法,其核心方法是基于频集理论的递推方法。这是一个采用两阶段频集的挖掘思想,并且基于多次扫描事务数据库来执行。正如算法名字,Apriori算法使用的是频繁项集性质的先验知识。
Apriori算法的设计可以分解成两个步骤来执行挖掘:
1、 从事务数据库中挖掘出所有频繁项集。
首先挖掘出频繁1-项集。此时,在内存中保存两个表,一个保存每个项到一个整数的映射(如果项是其他非数值的对象),一个保存每个整数即项的计数。扫描整个数据集中的项,没扫描到一个项,在相应的位置计数器加一。最后根据支持度阈值筛选出支持度大于阈值的项组成
。
在挖掘频繁2-项集

Apriori算法是1993年由Agrawal等人提出的一种挖掘关联规则的基本算法,它利用频繁项集的先验知识,通过两阶段挖掘事务数据库。首先,从数据中挖掘出频繁项集,包括频繁1-项集和更高阶的频繁项集。接着,基于这些频繁项集生成关联规则。然而,Apriori算法在处理大量数据时,候选频繁项集的生成和验证过程可能导致效率低下和高资源消耗。
最低0.47元/天 解锁文章
1526

被折叠的 条评论
为什么被折叠?



