多目标优化算法在特征选择与车间调度问题中的应用
1. 区间成本特征选择问题
1.1 问题描述
在特征选择领域,区间成本特征选择(ICFS)问题是一个重要的研究方向。使用二进制策略,ICFS问题的一个解 $X$ 可表示为 $X = (x_1, x_2, \cdots, x_D)$,其中 $x_j \in {0, 1}$,$D$ 是数据集的特征数量。$x_j = 1$ 表示第 $j$ 个特征被选入特征子集,$x_j = 0$ 则表示该特征未被选中。
采用区间数 $\bar{u} = [u^-, u^+]$ 来表示获取一个特征数据的成本,其中 $u^-$ 和 $u^+$ 分别是区间 $\bar{u}$ 的下限和上限,且 $0 \leq u^- \leq u^+ \leq 1$。所有 $D$ 个特征的成本值可以用区间向量 $U = [\bar{u}_1, \bar{u}_2, \cdots, \bar{u}_D]$ 表示,其中 $\bar{u}_j = [u_j^-, u_j^+]$,$j = 1, 2, \cdots, D$。
ICFS问题的第一个目标,即与特征相关的成本 $f_1(X)$ 可计算为:
[f_1(X) = \sum_{j=1}^{D} \bar{u}_j x_j]
为了评估特征子集的分类性能,使用最近邻(1 - NN)方法作为分类器。该方法中,一个解的分类错误率 $f_2(X)$ 是错误预测样本数 $S_{ipc}$ 与所有样本数 $S_{all}$ 的比例,即:
[f_2(X) = \frac{S_{ipc}}{S_{all}}]
基于以上讨论,ICFS问题可建模为:
[IC
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



