相信大家一定听说过啤酒和尿布的营销案例【暂时先不去探讨是否是瞎编乱造的】,这个故事发生在20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,啤酒与尿布,两件看上去毫无关系的商品会经常出现在一个购物篮中,这种独特的Transaction现象引起了管理人员的注意,经过后续的跟进调查分析,发现这种现象多出现在年轻父亲的身上。
那么,如何挖掘出来这种关联模式呢?比较经典的挖掘方法有Apriori、FP Tree等,今天我们先详细探讨一下Apriori算法的实现原理,随后给出Python源码,并结合现有真实数据进行实战。
“
啤酒与尿布
”
的故事产生于
20
世纪
90
年代的美国沃尔玛超市中,
沃尔玛的超市管理人
员分析销售数据时发现了一个令人难于理解的现象:
在某些特定的情况下,
“
啤酒
”
与
“
尿布
”
两件看上去毫无关系的商品会经常出现在同一个购物篮中,
这种独特的销售现象引起了管理
人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上
“
啤酒与尿布
”
的故事产生于
20
世纪
90
年代的美国沃尔玛超市中,
沃尔玛的超市管理人
员分析销售数据时发现了一个令人难于理解的现象:
在某些特定的情况下,
“
啤酒
”
与
“
尿布
”
两件看上去毫无关系的商品会经常出现在同一个购物篮中,
这种独特的销售现象引起了管理
人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上
def loadSampleDataSet(): return [[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2