多复杂值数据的广义粒化模型
1 引言
在现实世界的应用中,决策表中的数据往往具有多种复杂格式,如模糊型、文字型、区间型、随机型等。传统的粒化方法通常将实值变量划分为若干区间,同一区间内的对象被分配到同一个清晰的粒中,但这种划分方式会导致信息丢失,且在现实世界中,空间的清晰划分很少见,粒化过程中分区之间存在一定程度的重叠是常见的。目前,大多数粒计算模型通过将精确的二元等价关系扩展为常见的软二元关系来考虑模糊粒。然而,对于具有多种复杂数据类型的决策表,如何为这些复杂值数据塑造合适大小的粒是需要解决的关键问题。
2 多复杂值数据的统一不确定性描述
2.1 决策表定义
决策表用五元组 $T = {U, C, D, V, f}$ 表示,其中:
- $U = {o_1, o_2, …, o_n}$ 是一个有限非空的对象集。
- $C = {c_1, c_2, …, c_n}$ 包含反映对象特征的条件属性。
- $D$ 表示决策属性。
- $V = \bigcup_{a\in C\cup D} V_a$ 是属性 $a$ 的域。
- $f$ 是一个函数,对于每个 $a \in C \cup D$ 和 $o \in U$,有 $f(o, a) \in V_a$,称为信息函数。
2.2 不同类型复杂数据的不确定性描述
- 区间数据 :对于 $\forall c \in C$,$o \in U$,如果 $f(o, c)$ 在 $[v_1, v_2]$($v_2 > v_1$)中取数值,则可将其描述为在区间 $[v_1, v_2]