市场篮分析与主成分分析:数据降维的有效方法
市场篮分析:数据筛选与常见篮的寻找
市场篮分析是一种强大的数据挖掘技术,可帮助我们发现数据中的关联规则。在进行主要分析步骤之前,我们需要为算法指定一些参数。
首先,我们设定支持度阈值为 10%,这意味着我们只关注那些在至少 10% 的调查响应中出现的项目组合。
support_thresh<-0.1
接下来,我们找出所有满足支持度阈值的单项篮:
firstpass<-unname(which(colMeans(mktdummies,na.rm=TRUE)>support_thresh))
这一步展示了所有至少被 10% 的受访者以相同方式回答的调查项目集合。
然后,我们定义所有可能的两项篮候选者,这些候选者的支持度可能超过 10%:
secondcand<-t(combn(firstpass,2))
secondpass<-NULL
secondcand 是我们第二次筛选的候选集, secondpass 用于存储第二次筛选的结果。由于还未开始第二次筛选, secondpass 初始值为 NULL 。
为了检查 secondcand
超级会员免费看
订阅专栏 解锁全文
22

被折叠的 条评论
为什么被折叠?



