关联规则:关联规则是描述在一个交易中物品之间同时出现的规律的知识模式,更确切的说,关联规则是通过量化的数字描述物品A的出现对物品B的出现有多大影响
A与B是独立的两个非空事务,且A、B同属于一个事务集,那么关联规则是形如A=>B的蕴含式。
关联规则有两种度量标准:支持度和置信度
支持度support
规则A=>B在事务集D中成立,具有支持度S。S是事务集D中事务包含AUB的百分比P(AUB),记做
support(A=>B) = P(AUB)
设事务集D中包含n个事务,D中包含A同时包含B的事务共c个。
support(A=>B) = P(AUB)
=Freq (AUB) / n
=c / n
置信度confidence
置信度为在出现数据项集A的前提下,出现数据项集B的概率,其置信度就是条件概率P(B/A),即
confidence(A=>B)=P( B/A )
设事务集D中共有n个事务,