基于概念聚类算法的微阵列分析方法的最优选择
在现代生物医学研究中,微阵列技术的出现为同时监测数千个基因的RNA丰度变化提供了可能,极大地推动了相关领域的发展。然而,面对海量的微阵列数据,如何选择合适的分析方法成为了一个亟待解决的问题。
1. 背景与问题提出
随着分子生物学和计算技术的进步,微阵列技术得以广泛应用。为了应对分析大量微阵列数据的统计挑战,涌现出了许多新的方法,如T - 检验、排列检验、方差分析和重复测量方差分析等。但目前缺乏有效的计算方法来帮助理解差异基因表达谱,也难以确定哪种方法最能可靠地识别不同谱之间的差异。研究发现,常用的统计方法不能识别所有可观察到的不同谱,且没有一种方法能涵盖其他方法的结果。
2. 方法概述
为了解决上述问题,提出了一种概念聚类方法,旨在发现微阵列分析方法的最优关联,以识别差异基因表达谱。该方法主要包括以下六个阶段:
1. 数据集预处理 :对原始微阵列数据进行预处理,为后续分析做准备。
2. 差异表达基因的识别 :应用多种统计技术,如Student’s T - 检验、排列检验、方差分析和重复测量方差分析等,从一个实验条件到其他条件检索差异表达基因。
3. 方法关联的检测 :安排一个包含所有可能的统计方法关联的格结构。方法关联表示为:
[
\left{M_{1} \oplus M_{2}, M_{1} \oplus M_{3}, \cdots, M_{1} \oplus M_{n}, M_{2} \oplus M_{3}, \cdots, M_{n - 1}