混合智能技术与中性集在数据处理中的应用
在当今的数据处理领域,面对高维、复杂且不确定的数据,传统方法往往显得力不从心。混合智能技术以及新兴的中性集理论为解决这些问题提供了新的思路和方法。下面将详细介绍相关技术及其应用。
混合智能技术在特征降维和分类中的应用
在基因数据分析中,高维数据的处理是一个关键问题。为了有效处理这些数据,研究人员采用了多种混合智能技术进行特征降维和分类。
降维方案的实施
降维方案的实施步骤如下:
1. 数据归一化 :对训练集的每一列进行归一化处理,使每列的均值为零,方差为一。
2. 目标属性赋值 :将二元目标属性的值设置为 0 或 1。
3. 构建 PLS 模型 :指定偏最小二乘回归(PLS)的组件数量,将原始训练集输入 SIMPLS 算法,构建训练数据集的 PLS 模型。
4. 形成新训练集 :将 PLS 算法的输出得分视为输入变量的值,形成分类算法的训练集。
确定 PLS 组件的最佳数量
生物学家常常希望统计学家回答诸如“哪些基因可用于肿瘤诊断”的问题,因此基因选择是一个重要问题。研究发现,PLS 方法能够内在地进行基因选择。对于二元响应数据集,通过证明发现,使用 BSSj/WSSj 对基因进行排序与使用 aj² 进行排序的结果相同。这意味着 SIMPLS 算法计算的第一个 PLS 组件可用于基因排序和选择,且排序与最广泛接受的选择标准之一产生的排序相同。
超级会员免费看
订阅专栏 解锁全文
965

被折叠的 条评论
为什么被折叠?



