假设某个数据集包含d个项,试证明:从该数据集提取的可能规则的总数为:R=3^d-2^(d+1)+1.

证明:假设某个数据集包含d个项,试证明:从该数据集提取的可能规则的总数为:R=3^{d}-2^{d+1}+1.

例:数据集A={a,b,c},则可能规则有:{a}→{b,c};{b}→{a,c};{c}→{a,b};{a,b}→{c};{a,c}→{b};{b,c}→{a}.

题目出处:数据挖掘导论(完整版)第6章 关联分析:基本概念和算法 习题5

解:

1.要计算规则X→Y的总数,先计算|X\cup Y|的数目,从d项中取k项(k=2,3,4,...,d),即:|X\cup Y|=\sum^{d}_{k=2}\binom{d}{k}.

2.再从k项中取m项(m=1,2,3,...,k-1)作为规则左部的X项集,剩下的(k-m)项自然的成为右部的Y项集,故只需计算一次:\sum_{m=1}^{k-1}\binom{k}{m}=2^k-\binom{k}{0}-\binom{k}{k}=2^k-2.

3.当X\cup Y的项数为k时,可能规则的数目为:\binom{d}{k}(2^k-2),所以当k从2变化至d时,可能规则的总数为:\sum _{k=2}^{d}\binom{d}{k}(2^k-2)=\sum_{k=2}^{d}\binom{d}{k}2^k-2\sum_{k=2}^{d}\binom{d}{k}.

i.\sum_{k=0}^{d}\binom{d}{k}2^k=(2+1)^d=3^d.

注:牛顿二项式:(x+y)^n=\binom{n}{0}x^ny^0+\binom{n}{1}x^{n-1}y^1+...+\binom{n}{n}x^0y^n.

\therefore \sum_{k=2}^{d}\binom{d}{k}2^k=\sum_{k=0}^{d}\binom{d}{k}2^k-2\binom{d}{1}-\binom{d}{0}=3^d-2d-1.

ii.\sum_{k=2}^{d}\binom{d}{k}=\sum_{k=0}^{d}\binom{d}{k}-\binom{d}{0}-\binom{d}{1}=2^d-1-d.

iii.\therefore原式=(3^d-2d-1)-2(2^d-1-d)=3^d-2^{d+1}+1.

证毕。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值