(1)关联规则和频繁项集
A:关联规则的一般形式:
项集A、B同时发生的概率称为关联规则的支持度
项集A发生,则项集B发生的概率为关联规则的置信度
B:最小支持度和最小置信度
最小支持度:衡量支持度的一个阙值,表示项目集在统计意义上的最低重要性
最小置信度:衡量置信度的一个阙值,表示关联规则的最低可靠性
同时满足最小支持度阙值和最小置信度阙值的规则称为强规则
C:项集
项集是项的集合。包括k个项的项集称为k项集
项集的出现频率是所有包含项集的事务个数
若项集I的相对支持度满足预定义的最小支持度阙值,则I是频繁项集
D:支持度计数
项集A的支持度计数是事务数据集中包含项集A的事务个数,简称为项集的频率或计数
已知项集的支持度计数,则规则A→B的支持度和置信度易从所有事务计数、项集A和项集A U B的支持度计数推出
相关博客:http://blog.youkuaiyun.com/wo334499/article/details/51698810