基于混合GA/SVM的基因选择与分类方法
1. 特征选择方法综述
特征选择在分类问题中是一个活跃的研究领域,许多应用领域的数据包含成千上万的变量。常见的特征选择方法主要分为以下三类:
- 过滤法(Filter Approach) :将特征选择过程与分类过程分离,独立于分类所用的学习算法选择特征子集。多数情况下,该方法依赖对每个特征的单独评估,不考虑特征间的相互作用。
- 包装法(Wrapper Approach) :利用分类算法作为黑盒来评估每个候选特征子集,候选子集的质量由在训练数据上得到的分类器性能决定。该方法计算量通常较大,因为需要为每个候选子集训练分类器。例如,有使用进化算法结合k - 最近邻分类器、并行遗传算法、SVM包装器结合标准遗传算法等策略。还有将选择 - 分类问题视为多目标优化问题,同时最小化基因(特征)数量和错误分类示例数量。
- 嵌入法(Embedded Approach) :在特定学习机器的训练过程中进行特征选择。以支持向量机递归特征消除(SVM/RFE)方法为代表,该方法基于基因排名,每一步消除排名标准最小的基因,排名标准从在当前基因集上训练的SVM权重中获得。从某种意义上说,嵌入法是包装模型的扩展。
2. 基因选择与分类的通用模型
采用结合模糊逻辑、遗传算法(GA)和支持向量机(SVM)的混合方法,其通用模型是一个三阶段的顺序过程:
- 阶段1:模糊逻辑预处理
1. 将基因表达水平转换为具有高斯表示的模糊子集。
2. 使用余弦幅度法评估基因
超级会员免费看
订阅专栏 解锁全文
5001

被折叠的 条评论
为什么被折叠?



