基于R语言的Apriori算法应用案例
# 加载相关包
library(arules)
data("Groceries")
summary(Groceries)
#-------------------查看数据集信息
class(Groceries)
Groceries
dim(Groceries)
colnames(Groceries)[1:5]
rownames(Groceries)[1:5]
# basketSize表示每个transaction包含item的数目,是row level。
# ItemFrequency是这个item的支持度,是column level。
basketSize <- size(Groceries)
summary(basketSize)
sum(basketSize) # count of all 1s in the sparse matrix
itemFreq <- itemFrequency(Groceries)
itemFreq[1:5]
sum(iterFreq)
# 查看basketSize的分布:密度曲线(TO ADD HERE)
# itemCount表示每个item出现的次数
# Support(X) = Xs / N, N是总的交易数,Xs就是Item X的count。
# itemXCount = N * itemXFreq = (ItemXFreq / sum(itemFreq)) * sum(basketSize)
itemCount <-