关联规则挖掘

关联规则挖掘用于发现交易数据中的模式,如{Diaper} -> {Bear}。它包括生成频繁项目集(支持度大于最小支持度的项目集)和挖掘满足最小置信度的规则。Apriori原则和PF-Tree是减少候选项个数的有效策略,以降低计算复杂性。

关联规则挖掘

已知一组交易数据,找到根据交易中其他项目的出现来预测项目发生的规则。
例有如下市场交易情况
关联关系可为:
{Diaper} -> {Bear}
{Milk, Bread} -> {Eggs,Coke}
{Beer, Bread} -> {Milk}
PS: 以上表示意味着同时出现,而不是因果关系


定义:频繁项目集

  • 项目集Itemset
    • 一个或者多个项目的集合
      例如: {Milk, Bread, Diaper}
    • k-Itenset
      一个含有k个项目的项目集
  • 支持数Support count( δ )
    • 项目集出现的频度
    • 例如: δ ({Milk, Bread, Diaper})=2
  • 支持度Support
    • 包含项目集的事务的分数
    • 例如 s({Milk, Bread, Diaper})= 25
  • 频繁项目集
    • 一个支持度大等于最小支持度的项目集
  • 关联规则
    • 一种形式的含义表达 X->Y, 此处X和Y均为项目集
    • 例如:{Milk, Diaper}->{Beer}
  • 规则评估指标(Rule Evaluation Metrics)
  • 支持度Support(s)
    • 包含项目集的事务的分数
  • 置信度Confidence(c)
    • 衡量Y中的项目在包含X的交易中的频率
    • 例如:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值