Apriori algorithm是关联规则里一项基本算法,是由Rakesh Agrawal和Ramakrishnan Srikant两位博士在1994年提出的关联规则挖掘算法。关联规则的目的就是在一个数据集中找出项与项之间的关系,也被称为购物蓝分析 (Market Basket analysis),因为“购物蓝分析”很贴切的表达了适用该算法情景中的一个场景。
先上一下apriori的python实现的代码:
#! -*- coding:utf-8 -*-
#code write by guohao
import itertools
class Apriori(object):
def __init__(self,min_sup=0.2,dataDic={}):
self.data = dataDic #构建数据记录词典
self.size = len(dataDic) #统计事务个数
self.min_sup = min_sup #最小支持度阈值
self.min_sup_val = min_sup * self.size #最小支持度计数
def find_frequent_1_itemsets(self):
FreqDic = {} #用于统计物品的支持度计数
for event in self.data: #event为每一条记录
for item in self.data[event]: #item为项
if item in FreqDic:
FreqDic[item] += 1
else:
FreqDic[item] = 1
L1 = []
for ite

Apriori算法是1994年由Rakesh Agrawal和Ramakrishnan Srikant提出的关联规则挖掘算法,常用于购物篮分析。文章介绍了Apriori的核心步骤——连接步与剪切步,并提供了Python实现代码。通过分析代码,解释了为何在合成频繁项集时要确保前k-2个项相同,以简化问题并降低算法复杂度。
最低0.47元/天 解锁文章
598

被折叠的 条评论
为什么被折叠?



