多准则分类粗糙集方法的统计模型
在多准则分类问题中,数据的不一致性是一个常见的挑战。传统的粗糙集理论在处理这类问题时存在一定的局限性,因此出现了基于优势的粗糙集方法(DRSA)及其变量一致性变体(VC - DRSA)。本文将从统计和统计决策理论的角度深入探讨这些方法。
1. 相关概念与符号
- 给定训练对象集 $U = {(x_1, y_1), \ldots, (x_{\ell}, y_{\ell})}$,其中 $y_i \in T$ 表示决策值(类别分配)。
- 每个对象由 $n$ 个条件准则 $Q = {q_1, \ldots, q_n}$ 描述,$domq_i$ 表示属性 $q_i$ 的取值集合,假设 $domq_i \subseteq R$ 且具有线性序 $\geq$。
- 用 $q_j(x_i)$ 表示对象 $x_i$ 在属性 $q_j$ 上的评估值,$X = {x_1, \ldots, x_{\ell}}$,类 $Cl_t = {x_i \in X: y_i = t, 1 \leq i \leq \ell}$。
2. 经典可变精度粗糙集方法
经典粗糙集方法基于对象具有相同描述则不可区分的假设,不可区分关系 $I$ 定义为:
$I = {(x_i, x_j) \in X \times X: q_k(x_i) = q_k(x_j) \ \forall q_k \in Q}$
其等价类(颗粒)记为 $I(x)$。类 $Cl_t$ 的下近似和上近似分别定义为:
$Cl_t = {x_i \in X: I(x_i) \subseteq Cl_t}$
$
超级会员免费看
订阅专栏 解锁全文
55

被折叠的 条评论
为什么被折叠?



