数据挖掘与维度缩减技术全解析
1. 关联规则挖掘与优化
1.1 关联规则额外兴趣度量
除了使用 summary 和 inspect 函数检查关联规则外,还可以使用 interestMeasure 函数获取额外的兴趣度量。示例代码如下:
head(interestMeasure(rules, c("support", "chiSquare", "confidence",
"conviction","cosine", "coverage", "leverage", "lift","oddsRatio"), Groceries))
1.2 修剪冗余规则
在生成的规则中,常常会出现重复或冗余的规则。以下是修剪冗余规则的步骤:
1. 查找冗余规则 :
rules.sorted = sort(rules, by="lift")
subset.matrix = is.subset(rules.sorted, rules.sorted)
subset.matrix[lower.tri(subset.matrix, diag=T)] = NA
redundant = colSums(subset.matrix, na.rm=T) >= 1
- 移除冗余规则 :
超级会员免费看
订阅专栏 解锁全文

46

被折叠的 条评论
为什么被折叠?



