关联规则之apriori算法

本文介绍了购物篮分析的基本概念,包括规则、可信度、支持度及频繁项目集等,并解释了如何利用这些概念来发现有用的市场规律。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Basic concepts

规则:{x1,x2,…,xn} -> Y

 

    如果顾客把商品x1,x2,…,xn放入购物篮中的话,则很可能也会把商品Y放入其中。这个可能性(购买x1,x2,…,xn的前提下购买Y)称作规则的可信度,人们通常只对那些可信度大于某个值的规则感兴趣,希望把这些规则找出来。当然,有可能出现这样的情况,某些商品是被随机放入购物篮中的,例如:类似这样的规则,{牛奶,黄油}—〉面包,它的可信度非常大,可能是因为很多人都购买面包,象这样的规则是无用的。

 

可信度和最小可信度

    购买x1,x2,…,xn的情况下购买Y的可能性,条件概率

    confidence(A  => B ) = P(B|A)

 

支持度和最小支持度

    同时购买x1,x2,…,xn    Y的可能性

    support(A  => B ) = P(A U B)

 

频繁项目集

    满足最小支持度的项目集

 

一个重要的推理

    如果一个项目集S是频繁的(项目集S的出现频度大于最小支持度s),那么S的任意子集也是频繁的。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值