定义
关联分析
关联分析是指关联规则挖掘,它是数据挖掘中一个重要的、高度活跃的分支,目标是发现事务数据库中不同项(如顾客购买的商品项)之间的联系,这些联系构成的规则可以帮助用户找出某些行为特征(如顾客购买行为模式),以便进行企业决策。
事务数据库->关联分析法->关联规则
事务数据库
定义1 设I={
i1,i2,…,im}是一个全局项的集合,其中ij(1≤j≤m)是项(item)的唯一标识,j表示项的序号。事务数据库(transactional databases)D={
t1,t2,…,tn}是一个事务(transaction)的集合,每个事务ti(1≤i≤n)都对应I上的一个子集,其中ti是事务的唯一标识,i表示事务的序号。
定义2 由I中部分或全部项构成的一个集合称为项集(itemset),任何非空项集中均不含有重复项。
若I包含m个项,那么可以产生2的M次幂-1个非空项集。
例如,I={
i1,i2,i3