证明:假设某个数据集包含d个项,试证明:从该数据集提取的可能规则的总数为:
.
例:数据集A={a,b,c},则可能规则有:{a}→{b,c};{b}→{a,c};{c}→{a,b};{a,b}→{c};{a,c}→{b};{b,c}→{a}.
题目出处:数据挖掘导论(完整版)第6章 关联分析:基本概念和算法 习题5
解:
1.要计算规则X→Y的总数,先计算的数目,从d项中取k项(k=2,3,4,...,d),即:
2.再从k项中取m项(m=1,2,3,...,k-1)作为规则左部的X项集,剩下的(k-m)项自然的成为右部的Y项集,故只需计算一次:
3.当的项数为k时,可能规则的数目为:
,所以当k从2变化至d时,可能规则的总数为:
i.
注:牛顿二项式:
ii.
iii.原式=
证毕。