【数据挖掘】基于R语言的Apriori算法应用案例

本文介绍了如何使用R语言的arules库执行Apriori算法,以Groceries数据集为例,展示了数据预处理、支持度和置信度计算、规则挖掘及结果评估的过程,帮助理解关联规则在业务中的应用。

基于R语言的Apriori算法应用案例

# 加载相关包
library(arules)

data("Groceries")
summary(Groceries)
#-------------------查看数据集信息
class(Groceries)
Groceries
dim(Groceries)
colnames(Groceries)[1:5]
rownames(Groceries)[1:5]

# basketSize表示每个transaction包含item的数目,是row level。
# ItemFrequency是这个item的支持度,是column level。
basketSize <- size(Groceries) 
summary(basketSize)
sum(basketSize) # count of all 1s in the sparse matrix

itemFreq <- itemFrequency(Groceries) 
itemFreq[1:5]
sum(iterFreq)

# 查看basketSize的分布:密度曲线(TO ADD HERE)
# itemCount表示每个item出现的次数
# Support(X) = Xs / N, N是总的交易数,Xs就是Item X的count。
# itemXCount = N * itemXFreq = (ItemXFreq / sum(itemFreq)) * sum(basketSize)
itemCount <-

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

镰刀韭菜

看在我不断努力的份上,支持我吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值