定量关联规则评估与热力循环设计策略解析
在数据挖掘和工业过程设计领域,有两个关键问题备受关注:一是如何评估定量关联规则的质量,二是怎样设计高效的热力循环。下面将深入探讨这两个方面的内容。
定量关联规则评估
在数据挖掘中,关联规则挖掘是一项重要任务,而评估这些规则的质量至关重要。以下介绍几种关键的评估指标:
- 确定因子(Certainty Factor,CF) :由Shortliffe和Buchanan引入,用于表示MYCIN专家系统中的不确定性。它衡量了在仅考虑包含A的事务时,B出现在事务中的概率变化。确定因子取值范围为[-1, 1],当规则完全准确时取最大值1。计算公式如下:
- 当Conf(A ⇒ B) > Sup(B)时:
[CF(A ⇒ B) = \frac{P(A | B) - P(B)}{1 - P(B)} = \frac{conf(A ⇒ B) - sup(B)}{1 - sup(B)}]
- 当Conf(A ⇒ B) <= Sup(B)时:
[CF(A ⇒ B) = \frac{P(A | B) - P(B)}{P(B)} = \frac{conf(A ⇒ B) - sup(B)}{sup(B)}]
- 杠杆率(Leverage) :衡量A和B共同覆盖的额外案例比例,即相对于A和B相互独立时的情况。其值大于0是理想的,且杠杆率是支持度的下限,优化杠杆率可保证一定的最小支持度。计算公式为:
[lev(A ⇒ B) = P(A ∩ B) - P(A)P(B) = sup(A ⇒ B) - sup(A)sup(B)]
超级会员免费看
订阅专栏 解锁全文
1066

被折叠的 条评论
为什么被折叠?



