关联规则:原理、算法与应用
1. 引言
关联规则是挖掘商业数据库的重要工具,它能找出数据库中变量 $X = (X_1, X_2, … , X_p)$ 的频繁共同取值。作为一种机器学习技术,关联规则可用于发现大型数据项集合中有趣的隐藏关联和关系,市场篮分析就是一个典型例子。
市场篮分析基于这样的理论:如果顾客购买了某一组商品,那么他们更有可能(或不太可能)购买另一组商品。零售商可以利用这一技术识别顾客经常一起购买的商品之间的模式,在批发和零售业务中,市场篮分析有助于管理者更好地了解并服务客户。此外,它还可应用于借记卡和信用卡购买分析、电话通话模式分析、欺诈性汽车保险索赔识别等领域。
2. 市场篮分析
市场篮分析可通过交易数据来阐释。许多公司都能获取客户的交易数据库,其中包含客户的消费金额、消费频率和消费商品等信息。交易数据库由一组交易组成,每个交易是一组商品。
例如,表 1 展示了市场篮交易数据的示例:
| 日期 | 交易 ID | 商品 |
|----------|-------|------------------|
| 05/02/2020 | 1 | 牛奶, 尿布, 可乐 |
| 05/02/2020 | 2 | 牛奶, 啤酒 |
| 05/06/2020 | 3 | 书, 玩具 |
| 05/07/2020 | 4 | 尿布 |
| 05/07/2020 | 5 | 尿布, 玩具 |
| 05/08/2020 | 6 | 可乐, 牛奶, 玩具 |
市场篮交易数据也可以用二进制格式表示,如表 2 所示:
| 日期 | 交易
超级会员免费看
订阅专栏 解锁全文
1259

被折叠的 条评论
为什么被折叠?



