关联规则
用于描述几个参数之间的关联
基本概念:
项目集:
关联规则:
;
支持度(
):
;
置信度(
):
可以理解为:出现A的情况下出现B的概率。或者可以理解为这条箭头指向正确(即从A到B)或者该关联规则的可信几率。
基本算法:
Apriori
逐级搜索(level-wise search)以及大项目性质(Apriori property)
大项目集/频繁项目集:
大项目集性质:小的非空集所有超集都小,大的所有非空子集都大。
可以理解为商品销售记录的数据库
数据库中间的一条,即一个顾客的消费记录,可以看成是以顾客的消费为组织模式的项目集,与
的区别就在于组织方式的不同。
以及最小置信度:Minimum support threshold