Cosmetics.csv是14家A公司化妆品品种的1000个交易数据。A为了构建卖场商品陈列和交叉销售板职员的培训,以及增进交叉销售想分析物品购买之间的关联性。创建并的购买时间电子推荐系统,运行R code以回答以下问题:
在编写R code时,请同时包含注释(以#开头)说明命令行的含义
1)创建可执行的Rcode文件并单独提交(40分)
1)数据中14种产品的订单占比如何?请使用R创建一个图,表示每种产品的订单占比。(20分)
# 导入R包
library(tidyverse)
library(arules)
data <- read.csv("Cosmetics.csv")
## 去除ID
data <- data[-1.]
##去除那些每个值都是零的行,也就是不存在购物记录
##转换思维,每个数据都为0的行,则该行的和也为0
data1=data[which(rowSums(data) > 0),]
## 将购物商品组合到一个list和一个vector中
a_list <- list()
a_vec <- c()
product <- names(data1)
# 遍历
for (i in 1:nrow(data1)) {
v <- as.numeric(data1[i,])
idx <- which(v==1,arr.ind = TRUE)
a_list[[i]] <- product[idx]
a_vec <- c(a_vec,product[idx])
}
df<- data.frame(round(prop.table(