关联规则方法之apriori算法

Apriori算法是1994年由Rakesh Agrawal和Ramakrishnan Srikant提出的关联规则挖掘算法,常用于购物篮分析。文章介绍了Apriori的核心步骤——连接步与剪切步,并提供了Python实现代码。通过分析代码,解释了为何在合成频繁项集时要确保前k-2个项相同,以简化问题并降低算法复杂度。

        Apriori algorithm是关联规则里一项基本算法,是由Rakesh Agrawal和Ramakrishnan Srikant两位博士在1994年提出的关联规则挖掘算法。关联规则的目的就是在一个数据集中找出项与项之间的关系,也被称为购物蓝分析 (Market Basket analysis),因为“购物蓝分析”很贴切的表达了适用该算法情景中的一个场景。 

        先上一下apriori的python实现的代码:

#! -*- coding:utf-8 -*-
#code write by guohao

import itertools

class Apriori(object):
    
    def __init__(self,min_sup=0.2,dataDic={}):
        self.data = dataDic      #构建数据记录词典
        self.size = len(dataDic) #统计事务个数
        self.min_sup = min_sup   #最小支持度阈值
        self.min_sup_val = min_sup * self.size  #最小支持度计数

    def find_frequent_1_itemsets(self):
        FreqDic = {}   #用于统计物品的支持度计数
        for event in self.data:    #event为每一条记录
            for item in self.data[event]:   #item为项
                if item in FreqDic:
                    FreqDic[item] += 1
                else:
                    FreqDic[item] = 1

        L1 = []
        for ite
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值