MOSCFRA:用于同时聚类和基因排名的多目标遗传方法
1. 引言
微阵列技术能够在不同生物实验的不同时间点,为数千个基因生成全局且同步的表达水平视图,这在分子生物学和生物技术研究领域是一项重要工具。基因的生物学信息可通过微阵列表达模式(即基因表达数据)来描述。在微阵列数据中,每一行或列对应一个基因或组织样本,每行或列中的元素是一个实数,代表特定条件下该基因的表达水平。
对这类数据的分析主要包括两个部分:一是根据微阵列技术产生的原始数据构建基因表达矩阵,二是对这些矩阵进行分析。分析过程需要采用合适的挖掘策略,如聚类和基因选择。聚类是将共表达基因分组为具有生物学意义的群组,有助于推断与已知基因共表达的未知基因的生物学功能。聚类是一个无监督学习过程,旨在根据相似性或差异性指标将输入空间划分为K个区域。常用的距离函数包括欧几里得距离、曼哈顿距离等。聚类分析中的一个重要问题是评估聚类结果,即确定最符合底层数据的划分方式,这一过程被称为聚类有效性评估。
基因排名也是一个重要的研究课题。基因选择是一个组合问题,因此可以根据相关性为基因赋予权重或排名。大多数基因排名方法基于包装器方法或过滤方法,常见的启发式方法有输入空间的梯度下降和每次仅基于一个特征训练模型的AdaBoost。
本文提出了一种多目标方法,用于同时进行样本聚类和基因排名。据我们所知,利用多目标优化同时进行聚类和基因排名在该领域尚属首次。
2. 多目标优化
遗传算法(GAs)是一种流行的元启发式优化方法,但不能直接应用于多目标问题。传统的遗传算法需要进行修改,通过使用专门的适应度函数和引入促进解多样性的方法,以适用于多目标问题。优化多个目标通常有两种方法:一是将每个目
多目标遗传方法MOSCFRA
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



