1、先验算法概述
Apriori算法由R. Agrawal和R. Srikant在 1994 年给出,用于在数据集中查找关联规则的频繁项集。该算法的名称是 Apriori,因为它使用了频繁项集属性的先验知识。换句话说,我们可以说先验算法是一种关联规则学习,例如分析购买了产品 A 的人也购买了产品B。
我们举一个例子来更好地理解这个概念。比如比萨店的卖家将比萨、软饮料和面包棒组合在一起。他还为购买这些组合的客户提供折扣。你有没有想过他为什么要这样做?他认为购买披萨的顾客也会购买软饮料和面包棒。然而,通过制作组合,他让客户很容易购买并增加了他的销售业绩。
利用其知识,零售商可以为其产品制定交易,例如提供最佳规则折扣或根据客户一起购买的最佳关联规则的数量附加免费商品。无论哪种情况,客户最终都会花费更多来从这些交易中受益。其结果是,该企业提高了销售额,自然获得了高利润。
以上的例子是数据挖掘中关联规则的最佳例子。它有助于我们学习先验算法的概念。
2、先验算法原理
为了构建元素或项目之间的关联规则,该算法考虑了三个重要因素,即支持度、置信度和提升度。
Apriori算法是1994年由R. Agrawal和R. Srikant提出的,用于发现数据集中的频繁项集和关联规则。它基于支持度、置信度和提升度来衡量项集间的关联强度。例如,通过分析购买行为,零售商可以创建有效的组合促销策略。算法的优缺点包括易于理解和实现,但对计算资源的需求较高。提高效率的方法包括使用哈希技术、事务减少、分区和抽样等。
订阅专栏 解锁全文
911

被折叠的 条评论
为什么被折叠?



