关联规则挖掘:从基础到应用的全面解析
1. 关联规则挖掘基础
关联规则挖掘是数据挖掘领域的重要技术,旨在发现数据集中不同项目之间的关联关系。在进行关联规则挖掘时,我们需要关注几个关键概念,如支持度(support)、置信度(confidence)等。
首先,我们需要对交易数据进行处理,将其转换为适合挖掘的交易对象。以下是获取交易对象的代码:
get.txn <- function(data.path, columns){
# Get transaction object for a given data file
#
# Args:
# data.path: data file name location
# columns: transaction id and item id columns.
#
# Returns:
# transaction object
transactions.obj <- read.transactions(file = data.path, format = "single",
sep = ",",
cols = columns,
rm.duplicates = FALSE,
quote = "", skip = 0,