Basic concepts
规则:{x1,x2,…,xn} -> Y
如果顾客把商品x1,x2,…,xn放入购物篮中的话,则很可能也会把商品Y放入其中。这个可能性(购买x1,x2,…,xn的前提下购买Y)称作规则的可信度,人们通常只对那些可信度大于某个值的规则感兴趣,希望把这些规则找出来。当然,有可能出现这样的情况,某些商品是被随机放入购物篮中的,例如:类似这样的规则,{牛奶,黄油}—〉面包,它的可信度非常大,可能是因为很多人都购买面包,象这样的规则是无用的。
可信度和最小可信度
购买x1,x2,…,xn的情况下购买Y的可能性,条件概率
confidence(A => B ) = P(B|A)
支持度和最小支持度
同时购买x1,x2,…,xn 和Y的可能性
support(A => B ) = P(A U B)
频繁项目集
满足最小支持度的项目集
一个重要的推理
如果一个项目集S是频繁的(项目集S的出现频度大于最小支持度s),那么S的任意子集也是频繁的。