基于关联规则的策略挖掘方法介绍

        主要基于事物之间的相关性设置策略,如基于分析,发现A和B相关性非常高,如购买A商品,那大概率会购买B商品,A是风险客户,那大概率B同样是风险客户。

        关联规则有三个比较重要的概念:支持度、置信度、提升度

        1、支持度

        指单个事物或者某组合事物出现的次数与总事物次数的比值则表示为支持度

        2、置信度

        指的就是当你购买了商品 A,会有多大的概率购买商品 B,在包含A的子集中,B的支持度,也就是有A的子集中,同样包含B的子集的占比。

        3、提升度

        我们在做商品推荐或者风控策略的时候,重点考虑的是提升度,因为提升度代表的是A 的出现,对B的出现概率提升的程度。表示形式为:提升度 (A→B) = 置信度 (A→B)/ 支持度 (B)

        由于关联组合会随着事物出现的种类呈现递增,如何量大,则会导致相关指标的计算成本非常高,因此出现了Apriori算法,该算法剔除2个思想:

        1、某个项集是频繁的,那么它的所有子集也是频繁的

        2、如果一个项集是 非频繁项集,那么它的所有超集也是非频繁项集

        如果我们已知B不频繁,那么可以说图中所有绿色的项集都不频繁,搜索时就要这些项避开,减少计算开销。需要注意的是:

        1、如果支持度和置信度阈值过高,虽然可以在一定程度上减少数据挖掘的时间,但是一些隐含在数据中的非频繁特征项容易被忽略掉,难以发现足够有用的规则;

        2、如果支持度和置信度阈值过低,可能会导致大量冗余和无效的规则产生,导致较大计算量负荷。

详细介绍参考:关联规则:策略挖掘中必不可少的算法-优快云博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值