第11关:布尔数据集构建
任务描述
将以下超市的购买记录: I1:西红柿、排骨、鸡蛋、毛巾、水果刀、苹果 I2:西红柿、茄子、水果刀、香蕉 I3:鸡蛋、袜子、毛巾、肥皂、苹果、水果刀 I4:西红柿、排骨、茄子、毛巾、水果刀 I5:西红柿、排骨、酸奶、苹果 I6:鸡蛋、茄子、酸奶、肥皂、苹果、香蕉 I7:排骨、鸡蛋、茄子、水果刀、苹果 I8:土豆、鸡蛋、袜子、香蕉、苹果、水果刀 I9:西红柿、排骨、鞋子、土豆、香蕉、苹果 转换为布尔数据集,其中数据集用数据框来表示,数据框中的字段名称即为商品名称,如果商品在某个购买记录中出现用1来表示,否则为0。
相关知识
为了完成本关任务,你需要掌握:1.布尔关联规则挖掘,2.事务数据集转化为布尔(0、1)值数据表。
布尔关联规则挖掘
布尔关联规则挖掘是指将事务数据集转化为布尔(0、1)值数据集,并在布尔数据集基础上挖掘关联规则的一种方法。
数据集转化为布尔(0、1)值
算法如下: 1.定义一个空的字典D和包含所有商品的列表tiem=['西红柿','排骨','鸡蛋','茄子','袜子','酸奶','土豆','鞋子']
; 2.定义一个长度与数据集长度(事务个数)相同的一维全零数组z,循环操作商品列表tiem
,对每一个商品,搜索