模糊信息粒化与关联规则构建的粗糙集方法
一、多级粒度的模糊信息粒化
多级粒度计算(GrC)在解决现实世界问题中具有重要意义。它作为一种哲学和通用方法论,能在众多领域助力问题解决;作为结构化信息处理的范式,支持类人信息处理系统的发展。在问题解决的每个阶段处理不同粒度的能力,使GrC成为通过多级策略表示和解决问题的强大范式。
多级粒化过程为同一问题提供了多个粒化视图,让我们能够聚焦有用的信息结构,而无需陷入过多细节。以多级粒化策略提升对数据的理解为例,ML - DC框架可对数据进行多级粒化,在准确性和可解释性之间取得平衡。
将复杂问题划分为不同的上下文,这些上下文可对可用数据提供高层次且高度可解释的描述。通过这些上下文,我们可以局部获取更准确的模糊模型,同时仍保留可解释性约束,以实现知识的可读表示。最终的粒化结构可以提供一个既易于理解又准确的知识库。
原则上,MD - DC可以导出超过两个级别的粒化。然而,粒化级别越深,所获取知识的可理解性就越困难。通常认为两个级别足以在可解释性和准确性之间取得良好平衡,因为第一级从定性角度描述数据,而第二级提供更定量的描述。不过,根据具体应用领域,也可以考虑三个或更多级别。
二、关联规则相关内容
- 关联规则概述
- 关联规则是一种发现规则以表达现象之间联系强度的技术。例如,若从累积数据中得到规则“当顾客购买了商品A时,他/她也很可能购买商品B”,该规则能阐明商品A对商品B销售的贡献程度,还能在一定程度上预测顾客购买商品A后购买商品B的销量。
- 在关联规则中,支持值表示关联规则中所有元