多层次粒度的模糊信息粒化
1 引言
在过去十年里,信息粒化成为数据分析和信息处理的强大工具,它符合人类处理信息的方式。我们通过将知识、感知和获取的证据构建为信息粒来认识世界,这些信息粒是对复杂世界和现象的抽象。信息粒及其处理过程,即粒度计算(GrC),为解决实际问题提供了概念和算法框架。
GrC 涵盖多个学科,通常被宽泛定义为利用信息粒解决复杂问题的理论、方法、技术和工具的统称。目前已经提出了多种信息粒化框架,其中模糊集理论是 GrC 的主要形式之一,此外,粗糙集、区间分析、阴影集等形式也对 GrC 具有重要意义。
理想的信息粒化方法应具备两个主要特征:一是能够确定最能代表数据本质的粒度级别;二是能够为用户提供准确表示数据且具有清晰语义的信息粒,即对人类用户具有可解释性的信息粒。这两个特征促使 GrC 从以机器为中心的信息处理范式向以人为本的问题解决范式转变。模糊集理论在推动 GrC 成为以人为本的问题解决和信息处理范式方面发挥了重要作用。
为强调从以机器为中心的计算向以人为本的计算的转变,人们逐渐形成了将 GrC 视为具有多层次粒度概念的信息处理范式的观点。引入多层次粒度意味着考虑给定问题的多个抽象层次,每个层次捕捉问题的特定方面,这在一定程度上可以避免单一层次表示的局限性。接下来,我们将探讨多层次粒度计算的研究方向,重点关注模糊信息粒化,并介绍一种多层次模糊粒化方法。
2 多层次粒度计算
GrC 的基本组成部分是信息粒,它是由不可区分性、相似性、接近性或功能性等因素将不同对象聚集在一起的知识块。信息粒以概念的形式对现实进行抽象,因此粒化过程不仅用于设计模型,还能简化我们对模型的理解。作为计算单元,信息粒可以将复杂